《BMC Medical Informatics and Decision Making》:Development and validation of a machine learning model to predict hemostatic intervention in patients with acute upper gastrointestinal bleeding
编辑推荐:
为解决急性上消化道出血(UGIB)内镜干预预测准确性不足问题,研究人员开展相关机器学习模型研究,结果显示模型性能良好,有助于优化资源分配。
急性上消化道出血内镜干预预测模型的研究解读
在繁忙的医院急诊室里,急性上消化道出血(UGIB)患者并不少见。UGIB 是临床常见病症,每年每 10 万人中就有 80 - 150 人发病,死亡率在 2% - 15% 之间。它病情严重程度差异大,国际指南建议进行内镜检查前风险分层,以评估和分流患者,且食管胃十二指肠镜检查(EGD)应在症状出现后的 12 - 24 小时内进行,内镜治疗是控制高危再出血病变出血和预防再出血的主要手段。
然而,现有的风险分层评分系统,如内镜检查前 Rockall 评分(RS)、格拉斯哥 - 布拉奇福德评分(GBS)和 AIMS65 评分,虽在一定程度上能对患者进行风险分组,但它们的特异性有限,且主要不是针对预测止血干预。比如 GBS 虽有较高的敏感性,但在特异性方面表现不佳。在这种背景下,人工智能(AI)技术的发展为解决这一难题带来了希望。AI 能处理复杂数据集,在 UGIB 的风险分层、内镜检查结果和死亡率预测等方面已有不少成功应用,但精准预测 UGIB 患者内镜干预需求的机器学习模型仍较少。
为了填补这一空白,来自泰国玛希隆大学 Siriraj 医院的研究人员开展了一项重要研究。他们旨在开发一种机器学习模型,以预测急性 UGIB 患者是否需要内镜干预。
研究人员回顾性分析了 2011 年 1 月至 2020 年 12 月 Siriraj 医院收治的成年急性 UGIB 患者的前瞻性收集数据。这些数据涵盖了患者的人口统计学特征、临床表现和实验室参数。研究样本经过严格筛选,排除了院内发病、发病时间超过 72 小时以及数据缺失的患者,最终 1389 例患者纳入研究。
在数据处理方面,研究人员采用 One - Hot Encoding 方法处理分类数据,运用 z - 分数进行数据归一化处理。他们将数据集按 80% - 20% 的比例分为训练集和测试集,并通过分层 5 折交叉验证训练 15 种监督学习模型,包括线性判别分析、逻辑回归、朴素贝叶斯等。最终选择线性判别分析模型进行进一步优化和验证。
研究结果令人欣喜。在 1389 例患者中,44.3%(615 例)接受了内镜干预,其中包括 293 例静脉曲张出血和 336 例非静脉曲张出血干预。通过分析,确定了 18 个关键参数作为模型输入,包括年龄、性别、肝硬化、恶性肿瘤、抗血栓药物使用等。线性判别分析模型表现出色,其初始受试者工作特征曲线下面积(AUROC)为 0.74,经优化后在测试集中 AUROC 提升至 0.81,准确性为 70%,敏感性为 57%,特异性为 80%。该模型在预测内镜干预需求方面明显优于传统评分系统,如 GBS、RS 和 AIMS65 评分。
在研究结论和讨论部分,研究人员开发的机器学习模型能较好地识别需要内镜干预的急性 UGIB 患者,有助于基层医疗单位的医生对患者进行优先转诊,优化资源分配。不过,研究也存在一些局限性。数据收集时间跨度长达 10 年,医疗实践的发展可能影响结果;约 30% 的数据缺失可能导致偏差;部分影响管理决策的关键因素未纳入模型,如新型抗血小板药物、内镜检查时间、内镜检查前用药等;模型计算结果无法进一步得出 95% 置信区间(CI95%);UGIB 患者的管理依赖医生判断,不同医生的决策存在差异。
尽管如此,这项研究依然意义重大。它为急性 UGIB 患者内镜干预需求的预测提供了新的有效工具,推动了 UGIB 临床管理的发展。未来研究可进一步完善模型,纳入更多动态因素,进行外部验证,有望提高预测性能,为临床实践带来更大价值。该研究成果发表在《BMC Medical Informatics and Decision Making》上,为该领域的研究和临床应用提供了重要参考。