大语言模型助力儿科用药剂量精准计算:潜力与挑战并存

【字体: 时间:2025年03月16日 来源:Pediatric Research 3.1

编辑推荐:

  为降低儿科用药剂量计算错误,研究人员对比护士与 LLMs,发现部分 LLMs 精准快速,有重要意义。

  ### 儿科用药之困:大语言模型能否成为破局者?
在医疗领域,用药错误一直是个棘手的问题,就像隐藏在暗处的 “小怪兽”,时不时给患者带来伤害。尤其是在儿科用药方面,由于儿童的身体机能尚未发育完全,用药剂量需根据体重、年龄等因素精确计算,这无疑增加了用药的复杂性。据相关研究估计,美国每年因医疗错误死亡的人数高达 44,000 - 98,000 人,其中用药错误是可预防伤害的主要原因之一。尽管计算机化医嘱录入(CPOE)和临床决策支持系统(CDSS)等技术不断发展,但儿科用药剂量计算错误依旧顽固地存在。
面对这一困境,来自以色列多所机构的研究人员决心探索新的解决途径。他们将目光投向了近年来备受瞩目的大语言模型(Large Language Models,LLMs),想看看这些智能 “大脑” 能否在儿科用药剂量计算上发挥作用。这项研究成果发表在《Pediatric Research》杂志上,为儿科医疗安全领域带来了新的思考和方向。

研究人员开展了一项横断面研究。他们招募了 101 名来自儿科和新生儿科的护士,这些护士来自不同的工作岗位,有着不同的临床经验。同时,他们选择了三个具有代表性的大语言模型:ChatGPT-4o、Claude-3.0 和 Llama 3 8B 参与 “竞赛”。研究人员精心设计了一份包含 9 个问题的调查问卷,这些问题围绕儿科药物给药的剂量计算展开,涵盖了基于儿童体重、药物给药速率以及产品浓度等不同类型的计算场景。

研究人员采用了多种技术方法来确保研究的科学性和准确性。在数据收集方面,他们收集了护士的社会人口学数据,包括性别、年龄、工作年限等信息。对于调查问卷的回答,采用二进制评分系统,正确回答得 100 分,错误回答得 0 分,同时记录护士和 LLMs 的回答时间。在数据分析阶段,运用 SPSS Version 28 软件进行统计分析,计算连续变量的均值和标准差、分类变量的频率和百分比,通过 ANOVA 比较组间均值,并使用广义线性模型(GLM)分析预测任务表现。

研究结果令人眼前一亮。在准确性方面,护士的平均准确率为 93.14 ± 9.39%,而 Claude-3.0 和 ChatGPT-4o 展现出了完美的 100% 准确率,Llama 3 8B 的准确率为 66%。在回答时间上,LLMs 更是展现出巨大优势,它们的回答时间在 15.7 - 75.12 秒之间,而护士则需要 1621.2 ± 8379.3 秒。通过广义线性模型分析发现,任务表现受回答时长、相对资历和组别的交互作用显著影响,参与者的平均总分为 91.03(SD = 13.87) 。

从不同问题的回答情况来看,在大部分问题上,护士和 LLMs 的回答存在显著差异。例如在问题 2、3、4、5 和 8 上,差异非常显著(P<0.001);问题 6 和 9 的差异也较为显著(P<0.05);问题 7 的差异处于临界状态(P=0.05);只有问题 1,两者的回答没有显著差异。
濡ょ姷鍋涢悘婵嬪箟閿燂拷 免费获取QuantiNova定量试剂试用资格

进一步分析不同 LLMs 的计算过程,发现它们各有特点。ChatGPT-4o 采用简洁的三步法,先拆分问题,再进行计算,最后给出具体剂量;Claude 3.5 Sonnet 则遵循更详细的五步流程,增加了数值答案步骤,并可根据需要提供进一步解释;Llama 3 8B 在计算前会先评估问题难度,但在解释方面不如 Claude 3.5 Sonnet。

综合研究结果和讨论部分,这项研究意义重大。它首次定量比较了 LLMs 和经验丰富的护士在儿科用药剂量计算方面的表现,为人工智能在医疗领域的应用提供了新的视角。ChatGPT-4o 和 Claude 3.5 的出色表现,表明它们在辅助医疗专业人员进行复杂计算方面具有巨大潜力,有望成为减少儿科用药剂量错误的有力工具。然而,Llama 3 8B 的表现也提醒人们,并非所有的 LLMs 都能在医疗计算任务中表现出色,不同模型之间存在显著差异,在实际应用中需要对模型进行严格评估。

同时,研究也指出,尽管 LLMs 在计算速度和准确性上有优势,但它们无法完全替代人类临床判断。在用药过程中,药物选择的合理性、给药途径的适宜性以及对患者特定因素的综合评估等,依旧依赖医护人员的专业知识和经验。因此,LLMs 应被视为辅助工具,与人类医疗专业人员协同合作,共同保障儿科用药安全。

未来,随着技术的不断发展,LLMs 在医疗领域的应用前景广阔。但在此之前,还需要开展更多的研究,比如进行纵向评估,观察护士和 LLMs 在持续学习和更新后的表现变化;在真实临床环境中研究 AI 辅助计算对整体用药错误率的影响;探索 LLMs 在复杂临床场景中的应用能力等。只有通过不断探索和实践,才能更好地发挥 LLMs 的优势,为儿科医疗安全保驾护航,让孩子们在就医时能得到更精准、更安全的药物治疗。

婵炴垶鎸搁鍫澝归崶鈹惧亾閻熼偊妲圭€规挸瀛╃€靛ジ鏁傞悙顒佹瘎闁诲孩绋掗崝鎺楀礉閻旂厧违濠电姴娲犻崑鎾愁潩瀹曞洨鐣虹紓鍌欑濡粓宕曢鍛浄闁挎繂鐗撳Ο瀣煙濞茶骞橀柕鍥ㄥ哺瀵剟骞嶉鐣屾殸闂佽偐鐡旈崹铏櫠閸ф顥堥柛鎾茬娴狀垶鏌曢崱妤婂剱閻㈩垱澹嗗Σ鎰板閻欌偓濞层倕霉閿濆棙绀嬮柍褜鍓氭穱铏规崲閸愨晝顩烽柨婵嗙墦濡鏌涢幒鎴烆棡闁诲氦濮ょ粚閬嶅礃椤撶姷顔掗梺璇″枔閸斿骸鈻撻幋锔藉殥妞ゆ牗绮岄埛鏍煕濞嗘劕鐏╂鐐叉喘閹秹寮崒妤佹櫃

10x Genomics闂佸搫鍊瑰姗€骞栭—娓媠ium HD 閻庢鍠掗崑鎾绘煕濮樼厧鐏犵€规洜鍠撶槐鎺楀幢濮橆剙濮冮梺鍛婂笒濡粍銇旈幖浣瑰仢闁搞儮鏅滈悾閬嶆煕韫囧濮€婵炴潙妫滈妵鎰板即閻樼數鐓佺紓浣告湰濡炶棄螞閸ф绀嗛柛鈩冡缚閳ь兛绮欓弫宥夋晸閿燂拷

濠电偛妫庨崹鑲╂崲鐎n偆鈻旈悗锝庡幗缁佺櫉wist闂侀潧妫楅敃锝囩箔婢舵劕妫樻い鎾跺仜缂嶄線鏌涢弽銊у⒈婵炲牊鍘ISPR缂備焦绋掗惄顖炲焵椤掆偓椤︿即鎮ч崫銉ゆ勃闁逞屽墴婵″鈧綆鍓氶弳鈺呮倵濞戞瑥濮冮柛鏃撴嫹

闂佸憡顨嗗ú婊呭垝韫囨稒鍤勯柣鎰嚟閵堟挳骞栭弶鎴犵闁告瑥妫濆濠氬Ω閵夛絼娴烽柣鐘辩劍瑜板啴鎮ラ敓锟� - 濠电儑绲藉畷顒勫矗閸℃ḿ顩查柛鈩冾嚧閹烘挾顩烽幖杈剧秵閸庢垵鈽夐幘顖氫壕婵炴垶鎼╂禍婊冪暦閻旇櫣纾奸柛鈩冭壘閸旀帡鎮楅崷顓炰槐闁绘稒鐟ч幏瀣箲閹伴潧鎮侀梺鍛婂笧婢ф寮抽悢鐓庣妞ゆ柨鐏濈粣娑㈡煙鐠ㄥ鍊婚悷銏ゆ煕濞嗘ê鐏ユい顐㈩儔瀹曠娀寮介顐e浮瀵悂鏁撻敓锟�

婵炴垶鎸搁鍫澝归崶顒€违濠电姴瀚惌搴ㄦ煠瀹曞洤浠滈柛鐐存尦閹藉倻鈧綆鍓氶銈夋偣閹扳晛濡虹紒銊у閹峰懎饪伴崘銊р偓濠氭煛鐎n偄濮堥柡宀€鍠庨埢鏃堝即閻樿櫕姣勯柣搴㈢⊕閸旀帡宕濋悢鐓幬ラ柨鐕傛嫹

相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 急聘职位
    • 高薪职位

    知名企业招聘

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号