急性缺血性卒中如同健康路上的 “夺命猛虎”,在美国,它是导致死亡的主要原因之一。对于入住重症监护病房(ICU)的这类患者而言,及时识别出那些死亡风险高的个体,就像是在黑暗中找到指引方向的明灯,不仅能让医疗团队合理分配宝贵的医疗资源,还能帮助做出更精准的临床决策,从而挽救更多生命。然而,传统的预后评分工具在预测院内死亡率方面存在诸多不足。像是格拉斯哥昏迷量表(Glasgow Coma Scale,GCS)、牛津急性疾病严重程度评分(Oxford Acute Severity of Illness Score,OASIS)和美国国立卫生研究院卒中量表(National Institutes of Health Stroke Scale,NIHSS),它们使用的变量有限,大多只能识别线性关系,难以准确捕捉一些复杂的非线性关系,这就好比用一把简陋的尺子去测量复杂的曲线,结果必然存在偏差。
为了攻克这些难题,来自美国波士顿贝斯以色列女执事医疗中心(Beth Israel Deaconess Medical Center)的研究人员展开了一项极具意义的研究。他们致力于开发并验证基于机器学习的模型,以此来预测急性缺血性卒中患者在 ICU 中的院内死亡风险,并找出与之相关的重要因素。这项研究成果发表在《Health Data Science》杂志上。
在研究过程中,研究人员运用了多种关键技术方法。他们从医学信息库(Medical Information Mart for Intensive Care-IV,MIMIC-IV)数据库中获取数据,筛选出 3489 例符合条件的急性缺血性卒中患者的住院数据。在数据处理上,进行了细致的预处理和特征工程,对各类数据进行单独处理和提取。模型训练方面,探索了随机森林(random forests)、逻辑回归(logistic regression)和 XGBoost 这 3 种机器学习模型,并运用贝叶斯优化进行超参数调优。同时,利用多种分析方法,如特征重要性分析、消融分析以及公平性评估,来深入探究模型性能和相关因素的作用。