人工智能评估临床推理文档质量:临床学习环境对住院医师文档质量影响的观察性研究

【字体: 时间:2025年04月24日 来源:BMC Medical Education 2.7

编辑推荐:

  本研究利用人工智能(AI)技术,通过分析37,750份住院医师撰写的入院病历,探讨临床学习环境(CLE)对临床推理文档质量的影响。研究发现,患者年龄、基础疾病及特定诊断(如感染性和肺部疾病)与高质量文档相关,而夜班和早期接诊病例的文档质量更高。该研究为优化CLE提供了数据支持,并展示了AI在医学教育评估中的潜力。

  

在医学教育领域,临床推理(Clinical Reasoning)是住院医师培养的核心能力,而病历文档作为其重要载体,直接关联诊疗质量和患者安全。然而,传统人工评估方法效率低下,难以规模化分析临床学习环境(Clinical Learning Environment, CLE)对文档质量的影响。同时,CLE作为住院医师成长的关键场景,其工作负荷、团队结构等因素如何影响临床推理能力尚缺乏客观数据支撑。

针对这一难题,纽约大学格罗斯曼医学院的研究团队开展了一项开创性研究,利用人工智能(AI)技术对37,750份入院病历进行自动化评估,首次系统揭示了CLE与文档质量的关系。该研究发表于《BMC Medical Education》,为医学教育评估提供了新范式。

研究团队采用基于自然语言处理(NLP)的机器学习模型(Mayo cTAKES系统),对病历中"评估与计划"部分进行质量分类(高/低质量),训练数据来源于修订版IDEA评估工具(聚焦诊断推理DEA维度)。通过电子健康记录(EHR)提取患者年龄、Charlson合并症指数(CCI)等临床特征,以及班次(日/夜)、接诊顺序等CLE指标,采用广义估计方程(GEE)进行多变量分析。

研究结果呈现三大发现:

  1. 患者因素驱动文档质量
    老年患者(年龄≥80.1岁,aOR 1.13)、高合并症负担(CCI≥5,aOR 2.18)及特定诊断(如肺部疾病aOR 1.53)显著关联高质量文档,提示复杂病例可能激发更深入的临床推理。

  2. CLE的时空特征影响显著
    夜班文档质量优于日班(aOR 1.21),可能与专注接诊相关;而同一班次内每多接诊1例,质量下降7%(aOR 0.93),证实工作负荷的负面效应。COVID-19疫情期间(2019-2020学年),文档质量骤降8.1%,曼哈顿院区波动更剧烈,反映突发公共卫生事件对CLE的冲击。

  3. 培训体系差异塑造学习曲线
    社区型布鲁克林院区文档质量低于学术型曼哈顿院区(aOR 0.46),但高年级医师(PGY2-3)进步更显著(aOR 1.39),提示不同培训环境可能影响能力发展轨迹。

这项研究的意义在于:
首先,验证了AI评估复杂临床能力的可行性,其算法在150人日的等效工作量下完成传统方法难以实现的大规模分析。其次,为CLE优化提供实证依据,建议通过调整接诊上限、增设高级实践提供者(APP)支持等方式缓解认知负荷。最后,建立的自动化评估框架可扩展至其他机构,纽约大学团队已与辛辛那提大学合作验证跨机构适用性。

未来研究需结合大语言模型(LLM)实现更精细的文档分析,并探索文档质量与诊断错误的关联。正如作者强调,这项技术不仅适用于住院医师,未来可延伸至主治医师和APP群体,成为提升医疗质量的新工具。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号