基于机器学习的社区获得性肺炎分阶段识别模型构建与跨流行病环境验证研究
《Scientific Reports》:Staged identification of CAP in fever patients across epidemic environments: modeling & validation
【字体:
大
中
小
】
时间:2025年12月19日
来源:Scientific Reports 3.9
编辑推荐:
本研究针对资源有限环境下社区获得性肺炎(CAP)早期诊断难题,开发了基于多模态数据融合的机器学习分阶段识别模型。研究人员通过整合基础信息、病历资料和实验室指标,构建了α模型(就诊前)和β模型(增加四项实验室指标),在训练队列(n=1781)和外部验证队列(n=210)中均表现出良好预测性能(AUCinternal=0.93/0.80,AUCexternal=0.81/0.80)。该研究还通过潜类别分析(LCA)实现了CAP中医寒热证候的自动分类,为发热患者提供了一种敏感、稳健的CAP风险分层工具,并开发了在线计算器便于临床应用。
在呼吸道传染病高发的今天,社区获得性肺炎(Community-Acquired Pneumonia, CAP)作为常见的呼吸系统感染性疾病,其早期识别一直面临重大挑战。确诊CAP依赖昂贵的影像学检查,在突发疫情医疗资源紧张时,基层医疗机构、急诊和发热门诊的医疗挤兑现象尤为突出。尤其老年人群的肺炎临床表现隐匿,更难以早期识别,易导致治疗延迟。现有肺炎评估工具如肺炎严重指数(PSI)和CURB-65等多用于评估住院患者病情严重程度,且需要完成大量辅助检查,患者使用困难,门诊患者也难以完成所有必要检查来计算评分。
更为复杂的是,不同流行病环境下病原体的流行特征会发生显著变化。COVID-19疫情期间,中国实施了长期严格的防控政策,创造了独特的流行病学环境。在这种有效阻断冠状病毒传播的特殊社会环境下,流感病毒等病原体成为呼吸道病毒感染的主流。而政策调整后,奥密克戎变异株广泛流行,其重症比例和病死率较低,但传播力和免疫逃逸能力更强。这使得模型在不同流行病环境、甚至出现新病原体的情况下准确识别肺炎患者成为新的挑战。
针对这一系列难题,北京中医药大学的高子恒、陈腾飞等研究团队在《Scientific Reports》上发表了一项创新研究,开发并验证了一种跨流行病环境的发热患者CAP分阶段识别模型。该研究旨在提供一种易于使用、敏感且稳健的工具,用于CAP的早期检测,并根据临床症状对CAP亚型进行分类以支持中医标准化。
研究团队采用了几个关键技术方法:从北京中医药医院发热门诊收集了两个时空独立的队列数据(2021年12月-2022年12月的2193例就诊形成训练队列,2024年1月-7月的300例就诊形成外部验证队列);使用六种机器学习算法(逻辑回归、逻辑网络、随机森林、XGBoost、AdaBoost、CatBoost)进行模型构建,并通过10折交叉验证优化参数;采用多模态数据融合策略,开发了基于就诊前信息的α模型和增加实验室指标的β模型;应用潜类别分析(Latent Class Analysis, LCA)进行无监督学习以识别CAP临床亚型。
研究比较了训练队列中肺炎患者(n=362)与非肺炎患者(n=1419)的临床特征,发现年龄、最高体温(Tmax)、病程天数、咽部不适、咳嗽、呼吸困难和精神状态改变等7个变量在组间存在显著差异。实验室检查中,中性粒细胞计数(NEU)、淋巴细胞计数(LYM)、血小板计数(PLT)、C反应蛋白(CRP)以及中性粒细胞-淋巴细胞比值(NLR)、C反应蛋白-血小板比值(CRP/PLT)等6个指标也显示显著差异。
在模型判别性能比较中,α模型在外部验证中表现最佳的是CatBoost算法(AUCexternal=0.80, 95%CI 0.71-0.87),而β模型同样由CatBoost算法构建,在训练队列中AUC达到0.93(95%CI 0.92-0.95),在外部验证中为0.81(95%CI 0.70-0.90)。与α模型相比,β模型在训练队列中预测性能有显著提升(Zin=-13.91, P<0.001),而在外部验证队列中差异不显著(Zex=-0.32, P=0.748)。
研究进一步计算了α/β模型在内外验证中的最佳截断值和混淆矩阵。α模型和β模型在内外验证中的最佳截断值相似(α模型:内验证0.246,外验证0.222;β模型:内验证0.145,外验证0.151),反映了模型在不同流行病条件下的稳健性。重分类改善指数(Net Reclassification Improvement, NRI)分析表明β模型更优(NRIα/β_in=0.20;NRIα/β_ex=0.33)。
尽管采取了稳健性措施(变量筛选、10折交叉验证)以确保AUC稳定,但两个模型在外部验证中均出现性能衰减,其中β模型衰减较少。纯粹来自真实世界的外部队列(专门针对临床实践定制)-不受人工纳入/排除标准影响-当模型面对新的发热患者时暴露了泛化局限性。
校准曲线绘制用于评估校准性能。曲线越接近对角线(从左下到右上),校准越好。Brier评分用于评估概率预测的准确性,值越低表示性能越好。在外部验证中,使用CatBoost算法构建的α/β模型表现最佳。比较α和β模型,发现所有曲线都更接近对角线,表明集成建模策略确实提供了附加价值。
绘制临床决策曲线以评估临床效用。通过比较曲线与两条参考线(治疗所有患者和不治疗任何患者)的相交关系,评估应用模型的临床益处。在外部验证中,使用CatBoost算法构建的α/β模型在大部分概率范围内仍保持曲线高于两条参考线。
在建模前,研究已使用随机森林计算了变量的重要性排序。确定最终模型后,对α模型的预测变量再次进行SHAP可解释性分析,发现年龄与Tmax的交互项最高,表明其对α模型最重要。β模型纳入了额外的检测结果,并调整了已知α模型的预测概率。
成功开发CAP风险预测模型后,使用潜类别分析(Latent Class Analysis, LCA)这种无监督机器学习方法,仅基于临床表现的概率分布自动区分362例CAP患者的临床亚型。确定潜类别数为三个时,LCA识别出三个具有临床意义的类别:I类(n=48)病情较重,表现为精神状态改变和呼吸困难;II类(n=22)表现为恶寒、头痛身痛、恶心呕吐、腹痛和腹泻,符合中医寒证概念;III类(n=292)表现为发热、乏力、咳嗽、咽部不适,符合中医热证概念。
该研究开发并在外部验证了两个分阶段、逐步计算确诊CAP概率的预测模型。最终的α/β模型显示出令人满意的预测性能,是评估发热患者人群中CAP风险的新工具。CAP临床亚型的分类验证了现有中医区分寒热证的经验,为未来的标准化提供了支持。
研究表明,机器学习算法并不依赖组间极端临床特征差异,而是能有效捕捉常见临床特征及其交互作用对CAP风险的影响。因此,即使在不同的流行病环境下进行外部验证,模型仍具有良好的泛化能力。临床上,精神状态改变和呼吸困难是严重CAP的关键体征,容易提醒患者和医生。然而,轻微症状使CAP风险难以估计,常常延误诊断和治疗,特别是在老年患者中。该模型强调了年龄与其他因素的交互作用,突出了如Tmax、病程、咳嗽和咽部不适等轻微症状在老年患者中的预测价值。
在β模型中,基于临床经验使用NLR和CRP/PLT调整了α模型的预测概率。NLR是反映先天免疫反应(由NEU介导)和适应性免疫(由LYM支持)的生物标志物。NLR升高通常与炎症、组织损伤和全身炎症反应相关,因为在感染或免疫抑制期间中性粒细胞增加而淋巴细胞减少。CRP/PLT是基于临床实践提出的复合指标,反映了炎症、免疫和凝血的相互作用,这是呼吸道感染从轻症进展为重症的核心机制。
该研究的局限性在于其单中心、回顾性设计,未来的模型更新和改进研究应纳入多中心、前瞻性设计。最终α/β模型作为一种便捷的在线CAP筛查工具,使用了有限数量的临床特征。机器学习、多模态信息和融合策略的使用被证明是成功的。考虑到机器学习算法解释的复杂性,本研究补充了SHAP和RCS回归分析来评估每个预测变量的贡献。此外,还进行了LCA来探索CAP临床亚型的自然分类,为未来研究奠定了基础。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号