大语言模型助力儿科用药剂量精准计算:潜力与挑战并存

【字体: 时间:2025年03月16日 来源:Pediatric Research 3.1

编辑推荐:

  为降低儿科用药剂量计算错误,研究人员对比护士与 LLMs,发现部分 LLMs 精准快速,有重要意义。

  ### 儿科用药之困:大语言模型能否成为破局者?
在医疗领域,用药错误一直是个棘手的问题,就像隐藏在暗处的 “小怪兽”,时不时给患者带来伤害。尤其是在儿科用药方面,由于儿童的身体机能尚未发育完全,用药剂量需根据体重、年龄等因素精确计算,这无疑增加了用药的复杂性。据相关研究估计,美国每年因医疗错误死亡的人数高达 44,000 - 98,000 人,其中用药错误是可预防伤害的主要原因之一。尽管计算机化医嘱录入(CPOE)和临床决策支持系统(CDSS)等技术不断发展,但儿科用药剂量计算错误依旧顽固地存在。
面对这一困境,来自以色列多所机构的研究人员决心探索新的解决途径。他们将目光投向了近年来备受瞩目的大语言模型(Large Language Models,LLMs),想看看这些智能 “大脑” 能否在儿科用药剂量计算上发挥作用。这项研究成果发表在《Pediatric Research》杂志上,为儿科医疗安全领域带来了新的思考和方向。

研究人员开展了一项横断面研究。他们招募了 101 名来自儿科和新生儿科的护士,这些护士来自不同的工作岗位,有着不同的临床经验。同时,他们选择了三个具有代表性的大语言模型:ChatGPT-4o、Claude-3.0 和 Llama 3 8B 参与 “竞赛”。研究人员精心设计了一份包含 9 个问题的调查问卷,这些问题围绕儿科药物给药的剂量计算展开,涵盖了基于儿童体重、药物给药速率以及产品浓度等不同类型的计算场景。

研究人员采用了多种技术方法来确保研究的科学性和准确性。在数据收集方面,他们收集了护士的社会人口学数据,包括性别、年龄、工作年限等信息。对于调查问卷的回答,采用二进制评分系统,正确回答得 100 分,错误回答得 0 分,同时记录护士和 LLMs 的回答时间。在数据分析阶段,运用 SPSS Version 28 软件进行统计分析,计算连续变量的均值和标准差、分类变量的频率和百分比,通过 ANOVA 比较组间均值,并使用广义线性模型(GLM)分析预测任务表现。

研究结果令人眼前一亮。在准确性方面,护士的平均准确率为 93.14 ± 9.39%,而 Claude-3.0 和 ChatGPT-4o 展现出了完美的 100% 准确率,Llama 3 8B 的准确率为 66%。在回答时间上,LLMs 更是展现出巨大优势,它们的回答时间在 15.7 - 75.12 秒之间,而护士则需要 1621.2 ± 8379.3 秒。通过广义线性模型分析发现,任务表现受回答时长、相对资历和组别的交互作用显著影响,参与者的平均总分为 91.03(SD = 13.87) 。

从不同问题的回答情况来看,在大部分问题上,护士和 LLMs 的回答存在显著差异。例如在问题 2、3、4、5 和 8 上,差异非常显著(P<0.001);问题 6 和 9 的差异也较为显著(P<0.05);问题 7 的差异处于临界状态(P=0.05);只有问题 1,两者的回答没有显著差异。

进一步分析不同 LLMs 的计算过程,发现它们各有特点。ChatGPT-4o 采用简洁的三步法,先拆分问题,再进行计算,最后给出具体剂量;Claude 3.5 Sonnet 则遵循更详细的五步流程,增加了数值答案步骤,并可根据需要提供进一步解释;Llama 3 8B 在计算前会先评估问题难度,但在解释方面不如 Claude 3.5 Sonnet。

综合研究结果和讨论部分,这项研究意义重大。它首次定量比较了 LLMs 和经验丰富的护士在儿科用药剂量计算方面的表现,为人工智能在医疗领域的应用提供了新的视角。ChatGPT-4o 和 Claude 3.5 的出色表现,表明它们在辅助医疗专业人员进行复杂计算方面具有巨大潜力,有望成为减少儿科用药剂量错误的有力工具。然而,Llama 3 8B 的表现也提醒人们,并非所有的 LLMs 都能在医疗计算任务中表现出色,不同模型之间存在显著差异,在实际应用中需要对模型进行严格评估。

同时,研究也指出,尽管 LLMs 在计算速度和准确性上有优势,但它们无法完全替代人类临床判断。在用药过程中,药物选择的合理性、给药途径的适宜性以及对患者特定因素的综合评估等,依旧依赖医护人员的专业知识和经验。因此,LLMs 应被视为辅助工具,与人类医疗专业人员协同合作,共同保障儿科用药安全。

未来,随着技术的不断发展,LLMs 在医疗领域的应用前景广阔。但在此之前,还需要开展更多的研究,比如进行纵向评估,观察护士和 LLMs 在持续学习和更新后的表现变化;在真实临床环境中研究 AI 辅助计算对整体用药错误率的影响;探索 LLMs 在复杂临床场景中的应用能力等。只有通过不断探索和实践,才能更好地发挥 LLMs 的优势,为儿科医疗安全保驾护航,让孩子们在就医时能得到更精准、更安全的药物治疗。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号