基于随机森林与过程挖掘的医疗结果导向型流程映射研究
《Scientific Reports》:Outcome centred process mapping in healthcare using random forest and process mining
【字体:
大
中
小
】
时间:2025年12月11日
来源:Scientific Reports 3.9
编辑推荐:
本研究针对医疗流程复杂多变、难以优化的问题,提出一种结合随机森林(RF)与过程挖掘(PM)的逐步分析方法。研究人员利用MIMIC-IV数据集,以住院时长(LoS)为关键结果指标,识别出高龄、高急诊优先级及多重共病是影响LoS的核心因素,并构建了结果导向的流程地图。该方法为优化医疗资源配置、提升诊疗效率提供了新视角。
在全球医疗系统面临服务需求增长和医疗成本上升的双重挑战下,理解患者流程成为优化医疗资源配置的关键。然而,医疗流程天然具有高变异性,且医疗系统多为流程无感知系统,导致传统的流程挖掘方法往往产生难以解释的"意大利面式"模型,难以直接关联临床结果。为此,发表在《Scientific Reports》上的这项研究,提出了一种创新的方法,将随机森林的预测能力与过程挖掘的流程发现能力相结合,旨在从复杂的医疗数据中提取出以结果为中心、更具解释性的流程洞察。
研究人员采用了一种循序渐进的五阶段方法。首先进行数据管理与流程抽象,利用MIMIC-IV v2.2数据库(包含2008-2019年间Beth Israel Deaconess医疗中心的患者数据)构建事件日志。其次,确定以住院时长(LoS)为核心的过程结果,并整合患者人口统计学、急诊信息、共病指数等属性。第三阶段运用随机森林模型分析各属性对LoS的重要性排序。第四阶段基于重要性排名筛选关键属性(如Elixhauser共病指数(ECI)、急诊分诊优先级(Acuity)、年龄等),并据此对事件日志进行过滤,区分出短LoS和长LoS患者群体。最后,利用过程挖掘技术对过滤后的群体进行控制流发现、性能分析和合规性检查,比较不同LoS群体的流程路径差异。
通过直接跟随图和时间性能分析,研究发现短LoS患者群体(通常年轻、共病少、急诊优先级低)中,90%的病例流程为"进入急诊科后直接从急诊科出院",中位LoS为4小时。而长LoS患者群体(通常年长、共病多、急诊优先级高)中,79%的病例路径为"进入急诊科→入院→(可能转移)→出院",中位LoS达118小时。时间分析显示,除"进入急诊科至入院"环节外,长LoS群体在各环节间的中位时间均更长。
通过归纳挖掘算法生成流程模型并计算合规性指标(拟合度、精确度、泛化度),研究发现转移模型、急诊管理模型和医院管理模型具有较高的简洁性指数(64%-78%)和良好的精确度与泛化度,表明模型能较好地代表实际流程并处理未见过的合理变体。比较短LoS和长LoS事件日志在相同模型下的合规性,发现急诊管理和医院管理模型在精确度上存在显著差异(分别近10%和至少40%),揭示了不同LoS群体在流程行为上的本质不同。
本研究成功地将随机森林的特征重要性分析与过程挖掘的流程发现能力相结合,形成了一种结果导向的流程映射方法。该方法有效降低了流程模型的复杂性,增强了其可解释性,并清晰地揭示了特定患者属性(如高龄、高共病负担、高急诊优先级)如何影响其在医疗系统中的流动路径和最终结局。研究证实,这些复杂患者的流程更具独特性且难以预测,需要制定个性化的管理策略。该方法学框架不仅适用于医疗领域,对于其他流程无感知系统的优化也具有推广价值。未来工作可侧重于将该方法应用于实时预测、不同医疗数据集验证以及纳入更多影响因素(如床位可用性、节假日效应)等方面,进一步提升其在临床决策支持系统中的实用潜力。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号