编辑推荐:
为解决区域有效再生数(Rt)估计的数据稀疏问题,研究人员开发两步法,结果显示该方法预测准确性高,有助于资源分配。
在传染病肆虐的当下,有效控制疫情传播成为全球共同的挑战。有效再生数(
Rt)作为描述传染病传播能力的关键指标,其数值大于 1 意味着疾病正在扩散,小于 1 则表明传播在减弱。准确掌握
Rt对于制定科学合理的防控策略、优化资源分配至关重要。然而,现实中并非所有地区都能拥有充足的传染病数据。数据的稀疏或缺失使得精确估计
Rt困难重重,就像在迷雾中摸索,难以看清疾病传播的真实态势,这也给疫情防控决策带来了极大的阻碍。
为了冲破这团 “数据迷雾”,来自美国 Clemson University 等机构的研究人员开展了一项极具意义的研究。他们致力于开发一种灵活的框架,用于在地理区域层面估计有效再生数,尤其是解决数据稀疏地区的估计难题。该研究成果发表在《BMC Medical Research Methodology》杂志上。
研究人员采用了一种创新的两步法。第一步,运用现有的Rt估计程序,如 EpiEstim、EpiFilter 和 EpiNow2,利用数据充足地区的数据进行初步估计。这些方法各有特点,EpiEstim 通过期望最大化算法从聚合数据中重建每日发病率来估计Rt;EpiFilter 运用递归贝叶斯平滑技术,统一并扩展了其他方法;EpiNow2 则基于贝叶斯潜变量模型,结合概率编程语言 Stan 进行估计。同时,研究人员还采用了集成估计(ensemble-based estimation)的方法,综合多种模型的输出,以降低偏差和方差。
第二步,他们将第一步得到的结果纳入一个协变量调整的贝叶斯集成嵌套拉普拉斯近似(INLA)空间模型中。该模型能够整合空间位置信息和社会人口统计学协变量,如不同年龄组、种族、就业状况、健康保险覆盖率等因素,对Rt的初始估计值进行优化,从而为数据稀疏或缺失的地区提供更准确的Rt预测。
在数据方面,研究人员收集了美国南卡罗来纳州(SC)各县和邮政编码区域在新冠疫情第一波(2020 年 6 月 16 日至 8 月 31 日)和第二波(2020 年 12 月 16 日至 2021 年 3 月 2 日)的新冠确诊病例数据。同时,还获取了来自美国人口普查局网站的人口统计数据和有毒物质与疾病登记署网站的社会脆弱性指数(SVI)数据。
研究结果令人振奋。在预测数据完全缺失地区的Rt方面,研究人员评估了不同方法的准确性。结果显示,在县和邮政编码层面,基于两步空间 INLA 估计器预测的Rt值都达到了较高的准确性。在第二波疫情期间,EpiNow2 在完全缺失数据地区的Rt预测准确率最高,县层面的中位百分比一致性(PA)达到 92.5%(四分位距 IQR:91.6 - 93.4%),邮政编码层面为 96.5%(IQR:95.8 - 97.1%)。而其他方法如 EpiEstim、EpiFilter 和集成方法的预测准确率也各有表现,PA 值在一定范围内波动。
通过模拟研究,研究人员进一步验证了两步空间 INLA 框架的有效性。模拟生成的 COVID-19 病例数据显示,初始估计值经过空间 INLA 平滑后,与真实生成的Rt值更加接近,即使在模拟数据完全缺失的情况下,该框架仍能保持较高的预测准确率。
研究结论表明,这种两步空间 INLA 方法为小区域有效再生数的估计提供了有力的工具。它能够充分利用现有数据,通过整合空间信息和社会人口统计学协变量,从相邻地区 “借用” 信息,增强了Rt估计的稳健性。这一成果有助于公共卫生部门更精准地识别高风险地区,合理分配资源,如为传染病干预调配移动健康诊所,为医疗服务不足且传染病爆发风险高的社区提供及时的筛查、治疗和疫苗接种服务。
然而,研究也存在一定的局限性。该方法主要侧重于回顾性估计Rt,对于新兴病毒,由于疾病传播动态和人类行为可能因新变种的出现而发生显著变化,这种方法可能无法准确预测未来的Rt值。此外,研究中使用的Rt估计方法依赖于报告的发病率数据,数据的不准确或延迟可能导致偏差,而且研究未涵盖所有的Rt估计程序。
尽管如此,这项研究为传染病防控领域开辟了新的道路。未来的研究可以在此基础上进一步拓展,纳入对Rt值的预测和后续病例的预测,探索更多的Rt估计方法并优化集成估计技术,从而为应对传染病挑战提供更强大的支持。