基于先进机器学习技术增强创伤性脑损伤患者呼吸机相关性肺炎的预测研究

《Scientific Reports》:Enhanced prediction of ventilator-associated pneumonia in patients with traumatic brain injury using advanced machine learning techniques

【字体: 时间:2025年04月03日 来源:Scientific Reports 3.8

编辑推荐:

  在创伤性脑损伤(TBI)患者中,呼吸机相关性肺炎(VAP)显著增加患者的发病率、死亡率和医疗成本。研究人员利用 MIMIC III 数据库开展研究,经数据预处理、特征选择等,训练 6 种机器学习模型。结果显示 XGBoost 表现最佳,能有效预测 VAP,为临床干预提供依据。

  在医学的世界里,创伤性脑损伤(Traumatic Brain Injury,TBI)如同一个危险的 “暗礁”,威胁着人们的健康。全球每 10 万人中约有 250 人会受到 TBI 的影响,它在创伤相关死亡中占比达 30 - 50%,青少年、年轻人和老年人更是深受其害。而呼吸机相关性肺炎(Ventilator - associated Pneumonia,VAP)这个 “并发症恶魔”,在 TBI 患者使用机械通气时频繁出现,不仅加重患者病情、增加死亡风险,还延长住院时间,大幅提高医疗成本。为了早期识别和预测 VAP,改善患者预后并减轻医疗系统负担,众多研究人员不断探索,但此前的研究仍存在诸多不足,比如 TBI 严重程度与 VAP 发生之间的关系复杂,在特征选择、处理类别不平衡以及确保临床可解释性方面也面临挑战。
在这样的背景下,来自美国南加州大学(University of Southern California)工业与系统工程系、电气与计算机工程系以及加利福尼亚州立大学长滩分校(California State University, Long Beach)健康科学系的研究人员 Negin Ashrafi、Armin Abdollahi、Kamiar Alaei 和 Maryam Pishgar 等开展了一项重要研究,相关成果发表在《Scientific Reports》上。

研究人员主要采用了以下关键技术方法:

  1. 数据来源:使用公开的 MIMIC III 数据库,该数据库包含 2001 - 2012 年美国两家医院超 40000 名患者的详细医疗信息1
  2. 数据处理与特征选择:通过国际疾病分类第九版(ICD9)代码筛选 TBI 患者,经多次排除得到 836 例患者的最终队列。对数据进行缺失值处理、相关性检查,运用 CatBoost 算法并结合临床专家意见,从 52 个候选特征中选出 15 个关键特征23
  3. 模型构建与评估:采用合成少数过采样技术(Synthetic Minority Oversampling Technique,SMOTE)处理类别不平衡问题,在五折交叉验证框架内训练支持向量机(Support Vector Machine,SVM)、逻辑回归(Logistic Regression,LR)、随机森林(Random Forest,RF)、XGBoost、人工神经网络(Artificial Neural Network,ANN)和 AdaBoost 这 6 种机器学习模型,并进行超参数调整,以多种指标评估模型性能45

研究结果如下:

  1. 队列特征:将患者分为训练队列(585 例)和测试队列(251 例),对比发现两组在各临床指标上无显著差异,且 VAP 患者的 ICU 住院时间和总住院时间明显更长,气管切开术的发生率更高67
  2. 消融和敏感性研究:通过逐步消除特征的研究发现,去除任何一个特征都会导致模型性能下降,以受试者工作特征曲线下面积(Area Under the Receiver Operating Characteristic Curve,AUROC)为例,基线模型(包含 15 个特征)的 AUROC 为 0.94,去除特征后均低于该值,其中去除 ICU 住院时间导致 AUROC 下降最明显89
  3. 模型评估结果:经网格搜索优化 XGBoost 模型超参数,结果显示 XGBoost 在测试集上表现最佳,其 AUC 为 0.940(95% 置信区间 [0.935 - 0.954]),准确率为 0.875,敏感性为 0.896,特异性为 0.857,在综合性能上优于其他模型1011
  4. SHAP 特征重要性:SHAP 分析表明,ICU 住院时间和医院住院时间对预测模型影响最大,血清钾和血尿素氮等也有重要影响。较长的 ICU 住院时间和医院住院时间意味着更高的 VAP 风险,高血清钾和高血尿素氮水平对模型预测有不同程度的影响1213

研究结论和讨论部分指出:XGBoost 在预测 TBI 患者 VAP 方面表现卓越,相比以往研究,其 AUC、准确率等指标均显著提升。但该研究也存在局限性,如数据依赖于较旧的 MIMIC III 数据库,未整合多模态数据,处理类别不平衡的方法有改进空间,未考虑数据的时间依赖性,模型在临床实际应用中有待验证等。尽管如此,这项研究意义重大,早期准确检测 VAP 可指导更积极的干预措施,降低并发症相关死亡率,优化医疗资源分配。未来研究可利用更新的数据集(如 MIMIC - IV)、探索更多预测特征、整合模型到床边决策支持系统,进一步提升预测模型的准确性、通用性和实用性,为 TBI 患者的救治提供更有力的支持。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号