机器学习模型助力急诊科候诊时长预测:关键因素与临床应用

【字体: 时间:2025年03月19日 来源:BMC Health Services Research 2.7

编辑推荐:

  为解决急诊科(ED)候诊时间长问题,研究人员开展 ED 候诊时长预测研究,发现关键因素,具临床意义。

  在医院的急诊科(Emergency Department,ED)里,常常能看到患者们焦急等待的身影。对于很多人来说,等待就诊的时间长短,直接影响着他们对医疗服务的体验和自身的健康状况。理想的 ED 候诊时间应少于 30 分钟,但现实中,候诊时间却受到患者人口统计学特征、病情严重程度、交通方式、ED 拥挤状态等多种因素影响。长时间的等待不仅会降低医疗服务质量,导致患者未就诊就离开的比例增加、患者满意度下降,还可能使患者的临床结局恶化。传统的预测 ED 候诊时间的统计方法准确性较低,限制了其临床应用。虽然近年来机器学习(Machine Learning,ML)算法被用于预测 ED 候诊时间,但仍存在不足,且在实际应用前缺乏全面评估。为了更好地解决这些问题,来自美国约翰?彼得?史密斯健康网络综合急诊服务部等机构的研究人员开展了一项研究,相关成果发表在《BMC Health Services Research》上。
研究人员采用了单中心回顾性研究方法。他们选取了某城市三级转诊医院急诊科中,在 2019 年 1 月 1 日至 2021 年 12 月 31 日期间就诊且被分诊为急诊严重指数(Emergency Severity Index,ESI)3 级的患者作为研究对象。之所以选择 ESI-3 级患者,是因为 ESI 1 - 2 级患者平均候诊时间通常少于 30 分钟,而 ESI 4 - 5 级患者在该医院有专门的快速通道,候诊时间较短,ESI-3 级患者占急诊科病例的大多数,对他们进行候诊时间预测更具实际意义。同时,研究排除了没有记录候诊时间、缺少社会人口学数据或临床信息以及在分诊完成前离开的患者。

研究人员将候诊时间分为小于 30 分钟和大于等于 30 分钟(即延长候诊时间)两组。他们从患者社会人口学、临床相关和 ED 场所相关三个领域选取了多个特征,如年龄、性别、婚姻状况、保险覆盖情况、到达 ED 的方式、ED 拥挤状态等。为了预测患者延长候诊时间,研究人员运用了五种 ML 算法,分别是交叉验证逻辑回归(Cross Validation Logistic Regression,CVLR)、随机森林(Random Forest,RF)、极端梯度提升(eXtreme Gradient Boosting,XGBoost)、人工神经网络(Artificial Neural Network,ANN)和支持向量机(Support Vector Machine,SVM)。在数据处理过程中,他们将数据分为训练集(70%)和测试集(30%),通过超参数调整和交叉验证优化模型,并使用网格搜索五折交叉验证选择最佳性能的模型进行预测。

在模型性能评估方面,研究人员使用了准确率、召回率、精确率、F1 分数、假阳性率(False Positive Rate,FPR)和假阴性率(False Negative Rate,FNR)等指标。他们还利用 SHAP(Shapley additive explanations)值解释 XGBoost 模型的输出,展示特征重要性和特征关联,并使用部分依赖图(Partial Dependency Plots,PDP)说明特征对预测患者候诊时间的影响,同时对关键特征交互进行分析。

研究结果显示,在总共 177,665 名患者中,近一半(48.20%,85,632 名)经历了延长的 ED 候诊时间。较短候诊时间组的中位候诊时间为 5 分钟,而延长候诊时间组为 95 分钟。延长候诊时间组的患者通常更年轻,西班牙裔患者比例更高,非英语使用者更多,无保险覆盖的患者也更多。此外,该组中通过救护车到达的患者较少,而在 ED 过度拥挤期间就诊的患者比例较大。

五种 ML 算法在训练集和测试集上的性能准确率相当,表明模型没有过拟合。不同模型的 FPR 和 FNR 略有差异,且两者呈反比关系。在预测患者候诊时间时,FNR 更具临床相关性,因为假阴性意味着将候诊时间超过 30 分钟的患者错误分类为候诊时间少于 30 分钟。研究发现,影响患者候诊时间的关键特征包括患者到达方式和 ED 拥挤状态。例如,乘坐救护车到达的患者被预测候诊时间小于 30 分钟的比例更高,而 ED 处于不拥挤状态时,患者候诊时间小于 30 分钟的比例也更高。此外,年龄、性别、异常生命体征等因素也对模型预测有贡献。PDP 显示,乘坐救护车或在 ED 不太拥挤时到达的患者候诊时间较短,极端年龄(非常年轻或非常老)的患者候诊时间也较短。通过 XGBoost 模型分析发现,ED 过度拥挤状态和患者乘坐救护车到达这两个因素的交互作用对候诊时间预测影响最大。

研究结论表明,ML 模型在对患者 ED 延长候诊时间进行分类时表现出令人满意的性能。在评估延长候诊时间预测模型的性能准确率时,最大化召回率和最小化 FNR 具有更好的临床意义。影响患者延长候诊时间的关键因素是 ED 拥挤状态和患者到达方式。因此,实施缓解 ED 拥挤和减轻患者到达方式影响的策略,可能有助于改善 ED 的运营管理。

这项研究为 ED 候诊时间的预测提供了全面的分析,不仅评估了 ML 模型的性能,还深入解释了关键特征和特征交互的作用。然而,研究也存在一些局限性,如回顾性研究可能存在数据缺失或不准确的偏倚,单中心研究结果的普遍性有限,仅探索了五种 ML 算法,模型预测所包含的特征可能不足,且未进行模型预测的公平性评估等。未来的研究可以在这些方面加以改进,进一步推动 ML 模型在医疗领域的应用。

总之,这项研究为解决 ED 候诊时间长的问题提供了新的思路和方法,虽然还有待完善,但为后续研究和临床实践奠定了重要基础,有望在未来帮助医院更有效地管理急诊科,减少患者候诊时间,提高医疗服务质量。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
生物通微信公众号
微信
新浪微博

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号