针对计数数据分析的增强建模方法,重点关注物质使用结果

《Journal of Behavioral Medicine》:Enhanced modeling approaches for count data analysis with focus on substance use outcomes

【字体: 时间:2025年12月03日 来源:Journal of Behavioral Medicine 2.9

编辑推荐:

  本研究分析青少年吸烟行为数据,对比零膨胀泊松、负二项分布及混合beta模型,发现ZIBB和BBH能更好拟合含零多及U型分布的数据,提升行为医学研究的准确性。

  

摘要

选择合适的统计模型对于准确解释计数数据分析至关重要,尤其是在行为医学领域。传统上,人们常使用泊松(Poisson)模型和负二项(Negative Binomial)模型,但这些模型并不总是最佳选择,尤其是在处理包含大量零值的数据时。在这种情况下,可以使用零膨胀(zero-inflated)模型和零修正(zero-altered,即“障碍”模型)来更有效地进行建模。此外,数据呈U形分布(即数据集中在低值和高值两端,中间出现频率较低)的情况,传统方法无法充分捕捉,这进一步增加了分析的复杂性。本文批判性地分析了在青少年物质使用数据研究中广泛使用的零膨胀泊松(ZIP)模型和零膨胀负二项(ZINB)模型的局限性。我们使用了一个包含1263名青少年的吸烟研究数据集,这些青少年在八个时间点报告了他们的吸烟行为,分析了“过去一个月内吸烟天数”这一稀疏计数结果,并记录了每个时间点的性别、年龄和平均成绩(GPA)等协变量。通过多种方法对吸烟行为计数结果进行了全面评估:包括使用Kolmogorov–Smirnov(KS)检验进行模型识别、通过验证研究进行确认,以及基于赤池信息量准则(AIC)进行回归分析。所涵盖的模型包括:ZIP模型、泊松障碍模型(Poisson Hurdle,PH)、ZINB模型、负二项障碍模型(Negative Binomial Hurdle,NBH)、固定r值的零膨胀负二项模型(ZINB-r)、固定r值的负二项障碍模型(NBH-r)、零膨胀贝塔二项模型(Zero-Inflated Beta-Binomial,ZIBB)、贝塔二项障碍模型(Beta-Binomial Hurdle,BBH)、固定n值的零膨胀贝塔二项模型(ZIBB-n)、固定alpha和beta值的零膨胀贝塔二项模型(ZIBB-ab)、固定alpha和beta值的贝塔二项障碍模型(BBH-ab)、零膨胀贝塔负二项模型(Zero-Inflated Beta-Negative Binomial,ZIBNB)以及贝塔负二项障碍模型(Beta-Negative Binomial Hurdle,BNBH)。我们的研究证明了ZIBB模型和BBH模型在模型拟合和回归分析方面的优越性。值得注意的是,研究结果揭示了ZIBB模型在捕捉现实世界数据中的U形分布方面的有效性。这强调了在计数数据分析中探索更多模型类型的重要性。本研究提倡在行为医学中更广泛地应用这些更复杂的模型,以提高研究结果的准确性和可靠性。

选择合适的统计模型对于准确解释计数数据分析至关重要,尤其是在行为医学领域。传统上,人们常使用泊松(Poisson)模型和负二项(Negative Binomial)模型,但这些模型并不总是最佳选择,尤其是在处理包含大量零值的数据时。在这种情况下,可以使用零膨胀(zero-inflated)模型和零修正(zero-altered,即“障碍”模型)来更有效地进行建模。此外,数据呈U形分布(即数据集中在低值和高值两端,中间出现频率较低)的情况,传统方法无法充分捕捉,这进一步增加了分析的复杂性。本文批判性地分析了在青少年物质使用数据研究中广泛使用的零膨胀泊松(ZIP)模型和零膨胀负二项(ZINB)模型的局限性。我们使用了一个包含1263名青少年的吸烟研究数据集,这些青少年在八个时间点报告了他们的吸烟行为,分析了“过去一个月内吸烟天数”这一稀疏计数结果,并记录了每个时间点的性别、年龄和平均成绩(GPA)等协变量。通过多种方法对吸烟行为计数结果进行了全面评估:包括使用Kolmogorov–Smirnov(KS)检验进行模型识别、通过验证研究进行确认,以及基于赤池信息量准则(AIC)进行回归分析。所涵盖的模型包括:ZIP模型、泊松障碍模型(Poisson Hurdle,PH)、ZINB模型、负二项障碍模型(Negative Binomial Hurdle,NBH)、固定r值的零膨胀负二项模型(ZINB-r)、固定r值的负二项障碍模型(NBH-r)、零膨胀贝塔二项模型(ZIBB)、贝塔二项障碍模型(Beta-Binomial Hurdle,BBH)、固定n值的零膨胀贝塔二项模型(ZIBB-n)、固定n值的贝塔二项障碍模型(BBH-n)、固定alpha和beta值的零膨胀贝塔二项模型(ZIBB-ab)、固定alpha和beta值的贝塔二项障碍模型(BBH-ab)、零膨胀贝塔负二项模型(ZIBNB)以及贝塔负二项障碍模型(BNBH)。我们的研究证明了ZIBB模型和BBH模型在模型拟合和回归分析方面的优越性。值得注意的是,研究结果揭示了ZIBB模型在捕捉现实世界数据中的U形分布方面的有效性。这强调了在计数数据分析中探索更多模型类型的重要性。本研究提倡在行为医学中更广泛地应用这些更复杂的模型,以提高研究结果的准确性和可靠性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号