编辑推荐:
急诊室面临患者涌入多样、医护资源紧张及传统分诊系统易出现过度 / 不足分诊等问题。研究人员利用 AI 驱动的 NLP 算法分析医患对话,对患者严重程度自动分类。结果显示 SVM 性能最佳(AUROC=0.764),该研究为缓解急诊拥挤等提供新方向。
在急诊医学领域,快速精准的患者严重程度分诊是挽救生命的关键。然而,韩国急诊部门正面临着患者流量激增与医护资源不足的双重挑战,传统的韩国分诊 acuity 量表(KTAS)虽已应用,但依赖人工评估易出现过度分诊(高估病情)或不足分诊(低估危急情况),导致资源错配和救治延误。此外,急诊对话中常包含患者混乱表述、多人间断交流等非结构化数据,传统方法难以有效利用这些信息。在此背景下,开展基于真实急诊对话的自动化分诊研究,对提升急救效率、优化资源分配具有重要现实意义。
韩国嘉泉大学(Gachon University)与高丽大学(Korea University)的研究团队合作,针对急诊室中医护人员与患者的床边对话展开研究,旨在通过人工智能(AI)和自然语言处理(NLP)技术,开发一种基于对话内容的患者严重程度自动分类系统。该研究成果发表在《Scientific Reports》上,为急诊分诊的智能化提供了新的技术路径。
研究人员收集了韩国高丽大学三家附属医院急诊室 2022 年 6 月至 12 月期间的 1048 份分诊阶段医患及家属对话转录文本,数据覆盖 KTAS 3(严重)、4 和 5(轻微)等级别。研究采用两类 AI 算法:一类是基于词频 - 逆文档频率(TF-IDF)的传统机器学习模型,包括支持向量机(SVM)、逻辑回归(LR)、随机森林(RF)和极端梯度提升(XGB);另一类是神经网络模型,如多层感知机(MLP)、双向长短期记忆网络(BiLSTM)和卷积神经网络(CNN)。通过十折交叉验证评估模型性能,以受试者工作特征曲线下面积(AUROC)为核心指标。
模型性能比较
在传统机器学习模型中,支持向量机(SVM)表现最佳,AUROC 为 0.764(95% CI 0.019),逻辑回归(LR)紧随其后(AUROC=0.763)。神经网络模型中,多层感知机(MLP)的 AUROC 为 0.759,略高于双向长短期记忆网络(BiLSTM,AUROC=0.741)和卷积神经网络(CNN,AUROC=0.735)。尽管传统模型在 AUROC 上略占优势,但神经网络模型在召回率和精确率的平衡上表现更优,如 MLP 的精确率达 0.826,显示出对复杂对话语境的更强捕捉能力。
真实数据的挑战与创新
与既往基于模拟对话或结构化数据的研究不同,本研究首次利用真实急诊场景中的多人间断对话数据,包含患者因情绪紧张导致的混乱表述、家属补充信息的打断等 “噪音”。研究发现,TF-IDF 能有效提取与病情相关的关键词(如疼痛程度、症状持续时间),而神经网络模型通过捕捉对话序列中的上下文依赖(如 BiLSTM 的双向处理),可更好理解复杂语义关系。尽管模型性能受限于样本量(1048 例)和数据不平衡(KTAS 3 占 753 例),但证实了真实对话数据用于分诊的可行性。
与现有研究的差异化
对比韩国 Choi 等人基于分诊记录的 NLP 研究和 Lee 等人的模拟对话实验,本研究的独特价值在于:①数据来源于真实急诊现场,涵盖医患及家属的多方互动;②首次在韩国急诊环境中验证对话文本的独立分诊价值,为后续融合生命体征等多模态数据奠定基础;③发现传统机器学习与神经网络模型在不同维度的优势,为算法选择提供实证依据。
研究结论表明,基于急诊对话的 AI 分诊系统可辅助医护人员快速识别严重患者,缓解急诊拥挤并缩短等待时间。尽管当前模型性能(AUROC 0.711-0.764)受限于数据复杂性,但为引入大型语言模型(LLMs)和多模态融合提供了前期验证。未来研究方向包括:①扩大样本量并纳入 KTAS 1-2 级患者;②结合 SHAP 值等可解释 AI(XAI)技术,解析关键对话特征;③开发韩语医学专用 LLM,提升对复杂句式和方言的处理能力。
该研究突破了传统依赖结构化数据的分诊模式,证明非结构化对话蕴含丰富临床信息,为急诊医学与 AI 的交叉应用开辟了新路径。其成果不仅有助于优化韩国急诊资源分配,也为全球急诊 AI 分诊研究提供了真实世界数据范式,尤其对语言结构复杂的语种(如汉语、日语)具有方法学借鉴意义。通过持续优化算法和扩展数据维度,AI 驱动的对话分析有望成为未来急诊智能分诊的核心工具之一。