急性胰腺炎死亡率预测新突破:XGBoost 模型展现强大潜力

【字体: 时间:2025年03月04日 来源:BMC Gastroenterology 2.5

编辑推荐:

  为改善急性胰腺炎(AP)死亡率预测,研究人员构建 XGBoost 模型,其性能优于传统评分系统,意义重大。

  急性胰腺炎(Acute Pancreatitis,AP)是一种常见的胃肠道疾病,它就像一颗隐藏在人体里的 “不定时炸弹”,每年都有不少人因它而紧急住院。AP 的病情差异极大,大部分患者病情较轻,就像一场小感冒,能自我恢复;但约 20% 的患者却会发展为重症,引发多器官衰竭,死亡率高达 36 - 50% ,如同陷入一场可怕的重病危机。
目前,风险分层对于 AP 患者的治疗至关重要,它能帮助医生判断患者该接受何种程度的治疗,决定治疗的强度。自 1974 年以来,大约有 20 种评分系统被开发用于评估 AP 的严重程度和预测死亡率,比如常用的急性生理学与慢性健康状况评分系统(APACHE II)、兰森评分(Ranson score)和急性胰腺炎床边严重指数(Bedside Index for Severity in Acute Pancreatitis,BISAP)。然而,这些评分系统存在诸多问题。有些计算起来十分繁琐,在忙碌的临床实践中,医生很难快速准确地完成计算;而且它们大多依赖标准统计方法,分配固定权重,无法灵活适应不同患者的情况。此外,现有的评分系统也无法清晰地指导医生识别那些极低风险的患者,这些患者其实可以在普通病房安全监测,却可能因无法判断而被不必要地送入重症监护病房(Intensive Care Unit,ICU),既浪费了医疗资源,又增加了患者的负担。

为了解决这些难题,浙江大学医学院附属第一医院的研究人员 Meng Jiang、Xiao - peng Wu 等人开展了一项极具意义的研究。他们构建了一种可解释的机器学习(Machine Learning,ML)模型 ——XGBoost 模型,用于计算入住 ICU 的 AP 患者的死亡风险,并与现有的临床评分系统进行比较。该研究成果发表在《BMC Gastroenterology》上。

在研究方法上,研究人员主要采用了以下关键技术:

  1. 数据来源:从两个大型重症监护数据库,即重症监护医学信息库(Medical Information Mart for Intensive Care,MIMIC)和 eICU 协作研究数据库(eICU - Collaborative Research Database,eICU - CRD)收集数据。MIMIC 包含 2001 - 2019 年的患者数据,eICU - CRD 包含 2014 - 2015 年美国多家医院的患者数据。
  2. 模型构建与验证:利用 MIMIC 数据集训练 XGBoost 模型,并进行十折交叉验证,然后在 eICU - CRD 队列中进行外部验证。
  3. 模型评估:通过受试者工作特征曲线下面积(Area Under the Receiver Operating Characteristic Curve,AUC)、灵敏度、特异性等指标评估模型性能,并使用校准曲线、Hosmer - Lemeshow 检验和布里尔分数(Brier score)评估模型校准度。
  4. 模型解释:采用 SHapley Additive exPlanations(SHAP)方法解释模型的预测结果。

研究结果如下:

  1. 基线特征:研究共纳入 MIMIC 中 1782 例 AP 患者作为训练队列,其中 250 例死亡;纳入 eICU - CRD 中 507 例 AP 患者作为外部验证集,其中 34 例死亡。分析发现,非幸存者的年龄、部分生命体征、实验室指标等与幸存者存在显著差异。
  2. XGBoost 模型构建:排除缺失值较多的变量后,确定用于模型开发的特征。经过训练,模型在第 24 轮训练时在 eICU - CRD 验证队列中表现最佳,达到最大 AUC 和最小对数损失。
  3. 机器学习模型性能:在预测院内死亡方面,XGBoost 模型的 AUC 为 0.89(95% CI:0.84 - 0.94),优于随机森林、k 近邻(k - nearest neighbor,kNN)等其他机器学习模型,且校准度良好。与临床评分系统相比,虽然 XGBoost 模型的 AUC 与 APACHE IV、序贯器官衰竭评估(Sequential Organ Failure Assessment,SOFA)评分相比差异不显著,但高于 BISAP 评分。
  4. 识别极低风险患者:将模型和临床评分系统的灵敏度设定为 100% 以识别极低风险患者时,XGBoost 模型的特异性为 38%,远高于 APACHE IV、SOFA 和 BISAP 评分(分别为 1%、16% 和 1%) 。这意味着 XGBoost 模型能筛选出更多无需入住 ICU 监测的极低死亡风险患者。
  5. 可解释性:通过 SHAP 方法对 3 例患者进行分析,展示了模型如何根据患者的各项特征做出预测。例如,患者 1 因收缩压降低、格拉斯哥昏迷评分(Glasgow Coma Scale,GCS)低等因素,模型预测死亡概率为 9%,实际也死亡;患者 2 因年轻、部分指标正常等因素,模型预测死亡概率为 1%,实际存活;患者 3 因多种危险因素,模型预测死亡概率为 11%,实际也死亡。

研究结论与讨论:
XGBoost 模型在预测 AP 患者死亡率方面优于目前常用的临床风险评分系统。它能够更好地识别极低风险的 AP 患者,这些患者可以在普通病房安全监测,从而提高医疗资源的利用效率。而且,通过 SHAP 方法,医生能够理解模型的预测依据,增加了模型在临床实践中的可接受性。不过,该研究也存在一些局限性。比如,模型的特异性虽有提高,但仍未达到最佳;数据为回顾性收集,存在部分缺失;模型在其他人群中的表现还需进一步验证;受数据库限制,纳入的影响因素不够全面等。尽管如此,这项研究依然为 AP 患者的死亡率预测和风险分层提供了新的思路和方法,未来有望通过纳入更多前瞻性高质量数据,进一步优化模型,使其更好地融入临床决策支持系统,为 AP 患者的治疗带来更大的帮助。

涓嬭浇瀹夋嵎浼︾數瀛愪功銆婇€氳繃缁嗚優浠h阿鎻ず鏂扮殑鑽墿闈剁偣銆嬫帰绱㈠浣曢€氳繃浠h阿鍒嗘瀽淇冭繘鎮ㄧ殑鑽墿鍙戠幇鐮旂┒

10x Genomics鏂板搧Visium HD 寮€鍚崟缁嗚優鍒嗚鲸鐜囩殑鍏ㄨ浆褰曠粍绌洪棿鍒嗘瀽锛�

娆㈣繋涓嬭浇Twist銆婁笉鏂彉鍖栫殑CRISPR绛涢€夋牸灞€銆嬬數瀛愪功

鍗曠粏鑳炴祴搴忓叆闂ㄥぇ璁插爞 - 娣卞叆浜嗚В浠庣涓€涓崟缁嗚優瀹為獙璁捐鍒版暟鎹川鎺т笌鍙鍖栬В鏋�

涓嬭浇銆婄粏鑳炲唴铔嬬櫧璐ㄤ簰浣滃垎鏋愭柟娉曠數瀛愪功銆�

相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 急聘职位
    • 高薪职位

    知名企业招聘

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号