编辑推荐:
脓毒症常导致不良后果,传统预后预测方法存在局限。研究人员基于 MIMIC-IV v2.2 数据库,运用机器学习方法构建预测模型。结果显示,CatBoost 算法构建的模型表现优异,能早期识别脓毒症预后。这为临床评估和干预提供了重要参考12。
脓毒症,这个隐藏在重症监护病房(ICU)里的 “健康杀手”,正严重威胁着人们的生命安全。它是身体对感染产生的过度反应,就像免疫系统 “失控” 了一样,会引发一系列连锁反应,导致器官功能障碍,甚至发展为多器官衰竭,最终夺走患者的生命。据统计,2017 年全球约有 4890 万例脓毒症病例,造成 1100 万人死亡,占当年全球死亡人数的 19.7%;在中国 ICU 中,脓毒症发病率达 20.6%,90 天死亡率高达 35.5%。更棘手的是,部分患者即便熬过了急性期,也可能进入慢性危重病(CCI)阶段,需要长期的重症监护,这不仅给患者带来巨大痛苦,也消耗了大量医疗资源
3。
以往,医生主要依靠临床评分系统,如序贯器官衰竭评估(SOFA)、快速序贯器官衰竭评估(qSOFA)、全身炎症反应综合征(SIRS)和急性生理与慢性健康评估 II(APACHE II)等来预测脓毒症的预后。但脓毒症涉及多器官功能障碍,临床信息复杂,这些传统方法容易产生偏差。近年来,机器学习(ML)技术蓬勃发展,为脓毒症预后预测带来了新希望。它能处理复杂的临床数据,挖掘隐藏在数据背后的规律。基于此,南京中医药大学附属医院等机构的研究人员开展了一项极具意义的研究,相关成果发表在《BMC Medical Informatics and Decision Making》上4。
研究人员使用的关键技术方法主要有:数据来源于麻省理工学院计算生理学实验室开发维护的 MIMIC-IV v2.2 数据库,这是一个大型公开的危重症医学数据库。研究采用回顾性研究方法,运用差异分析和多项逻辑回归分析筛选相关特征,使用逻辑回归(LR)、随机森林(RF)和 CatBoost 算法构建预测模型,并通过 Shapley Additive explanations(SHAP)方法增强模型的可解释性56。
下面来看看具体的研究结果:
- 研究对象筛选:从 MIMIC-IV v2.2 数据库中筛选出符合脓毒症 3.0 诊断标准的患者记录,经过层层筛选,最终纳入 13174 例患者。
- 特征筛选结果:最初提取 56 个临床变量,经过数据处理和分析,最终筛选出 26 个变量用于模型构建。
- 模型开发与验证:将样本按 7:3 的比例分为训练集和验证集,构建并评估三种模型。结果显示,CatBoost 和随机森林表现出色,其中 CatBoost 的加权 AUC 达到 0.771,在预测死亡率方面效果最佳,AUC 为 0.8047。
- 最优模型解释:CatBoost 模型中,尿量、呼吸频率和体温是影响脓毒症预后的重要因素。不同预后的关键特征有所不同,如 CCI 的关键特征包括机械通气、平均动脉压(MAP)和年龄;死亡率的关键特征有尿量、血尿素氮(BUN)和年龄8。
研究结论表明,基于 CatBoost 算法开发的机器学习模型具备早期识别脓毒症预后的潜力。这意味着医生可以借助该模型,在疾病早期更准确地判断患者的预后情况,及时调整治疗方案。同时,研究还发现,针对尿量、呼吸状态和体温等因素进行早期干预,可能改变脓毒症患者的不良预后。
不过,研究也存在一些局限性。数据库的局限性使得数据集较为单一,影响模型的泛化能力;部分数据不完整,可能导致关键特征丢失;数据分布不均衡,尽管采取了加权处理,但仍可能影响模型性能;研究为回顾性研究,且模型仅进行了内部验证,缺乏外部验证9。
总体而言,这项研究为脓毒症多分类预测模型的发展提供了新方向。未来,研究人员计划开展多中心临床研究,收集更多外部验证数据,进一步评估模型的临床性能。如果模型在临床实践中得到验证,将有望开发出便捷的预测工具,应用于 ICU,辅助医生进行更精准的医疗决策,为脓毒症患者带来新的希望。