精准预测结核病风险:基于电子健康记录的创新模型优化潜伏结核筛查效率

《Nature Communications》:

【字体: 时间:2025年04月11日 来源:Nature Communications

编辑推荐:

  结核病(TB)防控形势严峻,加利福尼亚州疫情严重。为解决现有潜伏结核(LTBI)筛查效率低的问题,研究人员开发基于电子健康记录(EHR)的 TB 疾病临床风险预测模型。结果显示该模型提升了筛查灵敏度,优化了筛查效率,对改善 LTBI 筛查意义重大。

  在健康医学领域,结核病(Tuberculosis,TB)一直是一个不容忽视的重大问题。由结核分枝杆菌(Mycobacterium tuberculosis,Mtb)引起的 TB 疾病,会导致大量的发病和死亡。美国加利福尼亚州的 TB 病例绝对数在全美居首,2023 年有 22% 的 TB 病例发生于此。而且,该州达到了 TB 发病率和病例数的最高阈值,是疾病预防控制的重点区域。
当前,美国国内的 TB 防控主要聚焦于对潜伏结核感染(Latent Tuberculosis Infection,LTBI)的筛查和治疗,以防止其进展为 TB 疾病。然而,加利福尼亚州的情况却不容乐观。此前,加利福尼亚州公共卫生部门(California Department of Public Health,CDPH)推荐根据一些风险因素对无症状成年人进行 LTBI 筛查,如在高 TB 发病率国家(High Tuberculosis Incidence Country,HTBIC)出生、旅行或居住超 1 个月、免疫抑制、与 TB 患者密切接触等。但这些指南在实施过程中存在诸多问题,比如很多风险因素在患者的电子健康记录(Electronic Health Record,EHR)中难以识别,医疗人员在有限的诊疗时间内也难以全面落实筛查工作。研究发现,实际筛查中常常遗漏高风险人群,高达 62% 的 TB 疾病患者从未接受过 LTBI 筛查,这表明现有筛查方式未能有效识别出那些最有可能进展为 TB 疾病的人群。

为了改善这种状况,来自美国凯撒永久南加州(Kaiser Permanente Southern California,KPSC)和凯撒永久北加州(Kaiser Permanente Northern California,KPNC)的研究人员展开了一项重要研究。他们旨在开发一种能够利用 EHR 信息的临床风险预测模型,以更精准地识别未来 10 年内患 TB 疾病风险最高的个体,进而提高 LTBI 筛查的效率。这项研究成果发表在《Nature Communications》上,为 TB 防控带来了新的希望。

在研究过程中,研究人员运用了多种关键技术方法。他们以 KPSC 和 KPNC 的成员为样本队列来源,选取年龄≥18 岁、在 2008 - 2019 年期间连续参保至少 24 个月的成员作为研究对象。通过 Cox 比例风险回归构建预测模型,并使用 Harrell’s C 统计量、时间依赖性精度(阳性预测值)和召回率(灵敏度)曲线下面积(time - varying AUPRC)、平均校准和校准斜率等指标评估模型性能。同时,为了考虑现有筛查和治疗实践对 TB 疾病预防的影响,还采用了模拟 TB 疾病结果的方法进行分析。

研究结果如下:

  • 参与者情况:KPSC 队列用作开发和内部验证数据集,包含 4,032,619 人,其中 925 人在中位随访 4.6 年期间患上 TB 疾病(发病率为 4.1/100,000 人年)。KPNC 队列用作外部验证数据集,有 4,051,873 人,871 人在中位随访 6.9 年期间患病(发病率为 3.3/100,000 人年)。患病患者在种族、性别、年龄、BMI、合并症等方面具有一定特征。
  • 模型开发、设定和性能:研究人员将预测因子按重要性分为 3 层构建模型。综合考虑模型性能和可解释性,最终选择仅包含第 1 层变量分类形式的模型。该模型在内部和外部数据集上验证显示,Harrell’s C 统计量分别为 0.829 和 0.858 。考虑现有筛查和治疗预防的 TB 疾病病例后,最终模型在 100 次模拟的假设结果中,KPSC 和 KPNC 的 Harrell’s C 中位数分别为 0.793(95% SI 0.770, 0.809)和 0.817(95% SI 0.805, 0.824)。
  • 切点选择及与现有筛查比较:研究人员选择不同的 10 年风险切点,将最终预测模型与当前实际筛查和基于 EHR 的 CDPH 理想筛查进行比较。结果显示,在相同筛查比例下,模型筛查的灵敏度显著高于当前实际筛查。例如,在研究期间,KPSC 和 KPNC 实际筛查的灵敏度分别为 0.33(95% SI 0.27, 0.36)和 0.36(95% SI 0.34, 0.38),而模型筛查的灵敏度则分别提升至 0.64(95% SI 0.61 - 0.67)和 0.70(95% SI 0.68 - 0.71),同时需筛查人数(Number Needed to Screen,NNS)明显降低。

研究结论和讨论部分指出,新开发的 TB 风险预测模型相较于当前筛查策略,在筛查性能和效率上有显著提升。它能够利用 EHR 中易于获取的数据,确定高风险个体,从而更高效地分配筛查资源。虽然该模型在不同健康系统中的最佳筛查比例可能有所不同,但对于希望更精准、高效地开展 LTBI 筛查的医疗机构和医疗人员来说,无疑是一个极具价值的工具。

不过,研究也存在一些局限性。比如无法仅针对由 LTBI 进展而来的 TB 疾病病例进行研究,模拟的假设 TB 疾病结果也不够精确。未来研究可以开发更全面、严谨的模拟模型,以更深入地评估模型的有效性。总体而言,这项研究为 TB 防控提供了新的思路和方法,有望推动全球 TB 防控工作取得新的进展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号