编辑推荐:
为解决重症患儿院际转运死亡率高、缺乏实时风险评估工具的问题,伦敦相关团队开展 PROMPT 研究。结果显示该模型预测 30 天死亡率效果良好。推荐阅读,助你了解前沿的儿科重症转运预测技术。
在医疗领域,对于患有重症的儿童来说,及时且安全地转运至儿科重症监护病房(PICU)至关重要。随着医疗资源的优化配置,将专业的儿科重症护理集中在少数中心的做法逐渐普及,这一举措在降低成本的同时,提高了患者的健康水平。在英国,区域 PICU 建立后,专业的儿科重症护理转运团队(PCCTs)也应运而生,负责将其他医院的重症儿童转运至 PICU。
然而,PCCTs 在执行任务时面临着诸多挑战。重症儿童的病情极为复杂,在转运过程中,他们的状况可能会迅速恶化,例如在移动的救护车内,孩子的病情可能突然急转直下。而且,转运环境空间狭小、条件有限,再加上工作人员和资源的限制,使得转运工作困难重重。据统计,重症儿童在院际转运过程中,高达 22% 的病例会受到可预防的不良事件影响,并且他们在 PICU 的停留时间更长,死亡率约为 8%,这一数据明显高于其他入院患者。
在对患者病情的评估方面,现有的方法也存在不少问题。医护人员在转运时,主要依靠监测床边生命体征显示来发现异常,但缺乏对多变量风险因素的实时解释,这让他们在做出即时决策时面临很大困难。像儿科死亡指数 3(PIM3)这样的死亡率指标,虽然在早期稳定阶段估算死亡风险时很有用,但它只能提供患者某一时刻的 “快照”,无法捕捉转运过程中患者病情的动态变化。并且,PIM3 评分的实时准确性还可能受到重症监护环境中稳定后的病情严重程度和干预措施的影响。
另外,虽然数字和人工智能(AI)技术不断发展,智能算法在预测重症患者结局方面展现出了一定潜力,但现有的解决方案大多适用于静态的 ICU 环境,无法满足移动环境下的特殊需求。移动环境中患者病情动态多变、难以预测,环境因素复杂,这些都给临床和后勤工作带来了独特的挑战。
为了解决这些问题,来自伦敦相关团队的研究人员在《npj Digital Medicine》期刊上发表了一篇名为 “Patient-centred Real-time Outcome monitoring and Mortality PredicTion (PROMPT): an explainable machine learning pipeline for paediatric critical care transport” 的论文。研究人员提出了 PROMPT(以患者为中心的实时结果监测和死亡率预测)这一可解释的端到端机器学习流程,用于预测重症儿童在院际转运至 PICU 后的 30 天死亡风险。
研究人员在这项研究中用到了多个关键技术方法。首先,对收集到的患者数据,包括人口统计信息、临床数据、生命体征数据等,进行了全面的清洗、标准化和特征生成操作。之后,他们运用了随机森林(RF)、逻辑回归(LR)、极端梯度提升分布式梯度提升决策树(XGBoost)、卷积神经网络(CNN)和轻梯度提升机(LightGBM)这五种机器学习模型进行预测分析。在模型训练过程中,采用了样本划分、交叉验证等手段来优化模型性能。最后,使用 SHapley Additive exPlanations(SHAP)算法来解释模型的预测结果,探究各特征对模型输出的影响。
下面来看看具体的研究结果:
- 研究队列:研究人员分析了伦敦儿童急性转运服务(CATS)在 2016 年 7 月至 2021 年 5 月期间进行的 6470 次转运事件,最终聚焦于 1242 次非重复的儿科院际转运。这些转运涉及的儿童中位年龄为 8 个月,主要诊断为呼吸系统(34.8%)和心血管系统疾病(25.7%),中位 PIM3 预测死亡风险为 3.3% ,14.9% 的病例在转运过程中出现了关键事件,1168 名患者在 PICU 入院 30 天内存活,74 名死亡(其中 20 名在入院 48 小时内死亡)。
- 模型性能:运用 PROMPT 流程,上述五种机器学习模型在预测 30 天死亡风险时都表现出了一定的潜力。其中,RF 模型的表现最为出色,其受试者工作特征曲线下面积(AUROC)达到 0.83(95% 置信区间:0.79 - 0.86) ;LR 模型也表现良好,AUROC 为 0.81(95% 置信区间:0.76 - 0.85)。相比之下,传统的 PIM3 评分在预测方面则逊色不少,其 AUROC 仅为 0.71(95% 置信区间:0.66 - 0.76)。
- 特征对预测性能的影响:通过相关分析发现,年龄与体重之间存在显著的正相关(0.95),PIM3 指标与关键事件标签(CI_label)也呈正相关(0.32),而年龄与温度的功率谱密度(TEMP_PSD)呈负相关( - 0.31)。像 PIM3、体重和血管活性干预(Vaso_type)等特征,对模型的预测准确性有着重要影响。不同的机器学习算法对这些特征的依赖程度有所不同,LR 倾向于均匀分配特征重要性,而 RF、XGBoost 和 LightGBM 等集成技术则呈现出异质的重要性分布。
- 个体层面的动态风险评估:以一名患有代谢性酸中毒的男性新生儿为例,在转运初期,他的死亡风险相对较低,但随着转运接近结束,风险逐渐升高。研究人员分析发现,心率(HR)在第 140 分钟显著增加,收缩压(SBP)相对较低和血氧饱和度(SpO?)下降等因素,使得预测结果倾向于非存活;而正常的体温和舒张压(DBP)则有助于降低风险。通过分析可以看出,不同特征在不同时间点对死亡风险预测的影响是动态变化的。
- PROMPT 与 PIM3 的比较:PROMPT 利用丰富的数据,包括连续生命体征和电子健康记录(EHR)数据,在跟踪和预测患者病情严重程度方面表现更优。与 PIM3 相比,PROMPT 能更有效地识别出高死亡风险的患者,即使这些患者的 PIM3 评分较低。而且,PROMPT 在识别低风险病例方面也表现出色,减少了假阳性的情况。
在讨论部分,研究人员指出,这项研究首次利用院际转运期间收集的连续生理变量、EHR 和特定转运事件数据来预测重症儿童的 30 天死亡率,具有重要的意义。PROMPT 的优势不仅体现在模型的预测性能上,还体现在其可解释性方面。它能够为临床医生提供实时的风险评估,帮助他们更好地理解模型如何影响患者生命体征趋势和风险,从而做出更及时、有效的决策。
此外,研究还发现,一些特征对死亡率预测的影响会随着时间发生变化,这反映了模型能够捕捉到特征之间复杂的非线性关系和模式,使其在死亡率预测方面比基于单一时间点评估的 PIM3 更全面、准确。
不过,这项研究也存在一些局限性。例如,生命体征数据的采集存在不一致性,部分数据记录不完整,这可能导致样本的代表性不足,存在选择偏差。而且,该模型是在单一机构内开发和验证的,不同机构的医疗标准和实践存在差异,这可能会影响模型的通用性。另外,模型预测结果与患者实际风险之间的因果关系尚不明确,在应用模型时,需要结合临床判断和专业知识。
尽管存在这些不足,但研究人员已经在积极采取措施加以改进。他们计划与其他机构合作,扩大数据集的规模和多样性,进一步验证模型的性能。未来,研究人员还希望将 PROMPT 无缝集成到救护车上的边缘计算设备中,为转运团队提供实时的风险评估和决策支持,并且在连接安全云服务后,能够实现与接收医院的无缝交接,提高对重症儿童的救治效果。
总的来说,这项研究为院际转运中重症儿童的死亡率预测提供了新的思路和方法,PROMPT 的出现为改善儿科重症护理转运工作带来了新的希望,尽管还有很长的路要走,但它无疑为未来的研究和临床实践奠定了坚实的基础。