生成式 AI 助力虚拟病人问诊:可行性探索与医学教育新曙光

【字体: 时间:2025年02月25日 来源:BMC Research Notes 2.8

编辑推荐:

  为解决医学生病史采集训练资源有限、传统 VP 互动不真实等问题,韩国某学术医学中心研究人员开展生成式 AI 用于虚拟病人病史采集的可行性研究。结果显示该方法可行但有提升空间,推荐科研读者阅读,探索 AI 在医学教育的潜力。

  

在当今医疗教育领域,随着科技的飞速发展,人工智能(AI)技术逐渐崭露头角,吸引了众多研究者的目光。尤其是生成式人工智能技术,像大家熟知的 ChatGPT,更是引发了广泛关注。它在医疗教育中的应用潜力巨大,不少人都期待着它能为传统的医疗教育模式带来新的变革。


然而,理想很丰满,现实却有些骨感。虽然生成式 AI 在医疗教育的多个方面都展现出了可能性,但实际上,它的研究和实践才刚刚起步。目前,大部分相关研究和实践主要聚焦在利用 AI 进行医学知识评估,比如在医学执照考试中的应用。还有一部分是关于用 AI 自动生成考试题目。但在其他重要的医疗教育场景中,AI 的应用还远远不够成熟。


就拿医学生的医患互动训练来说,传统上,标准化病人(SPs)是常用的训练工具。标准化病人就像是经过特殊培训的 “演员”,他们能模拟真实病人的症状、体征和反应,帮助医学生练习与患者沟通、采集病史等技能。这种方式在一定程度上能够替代真实的临床患者接触,效果也还不错。可是,由于资源有限,医学生除了在一些重要的考核中能接触到标准化病人,平时练习的机会少之又少。


为了弥补这个不足,虚拟病人(VP)开始走进人们的视野。虚拟病人是一种利用计算机技术创建的模拟患者,医学生可以通过与它互动来练习临床技能。研究发现,虚拟病人对培养医学生的临床推理能力很有帮助。但早期基于非大语言模型(LLM)技术开发的传统虚拟病人存在不少问题,其中最明显的就是医患互动缺乏真实感。在与传统虚拟病人交流时,医学生往往只能从下拉菜单里选择预设好的问题来询问,就像是在玩固定套路的游戏,根本无法自由发挥,这和真实的医患交流相差甚远。


随着大语言模型和自然语言处理技术的发展,生成式 AI 迎来了新的机遇。它有望让医学生与虚拟病人的互动变得更加真实自然,就像和真正的患者对话一样。一些研究已经初步证明,生成式 AI 可以为医学生提供模拟患者体验,给出的答案大多比较合理,还能提供自动结构化反馈,用户体验也不错。但这并不意味着一切都完美无缺。AI 也有自己的 “小毛病”,比如容易产生幻觉,给出一些不合理、甚至错误的信息。而且在不同临床场景下,AI 的表现如何,能否普遍适用,目前还缺乏足够的研究。另外,AI 在医疗教育中能带来哪些可衡量的教育成果,相关证据也很匮乏。


在这样的背景下,为了探索生成式 AI 在医疗教育中的更多可能,韩国某学术医学中心人工智能医疗研究小组的研究人员开展了一项极具意义的研究。他们的研究成果发表在《BMC Medical Education》期刊上,论文题目是《Using generative artificial intelligence for virtual patients to practice history taking: a pilot feasibility study》 。这项研究旨在设计和开发一个利用生成式 AI 技术的虚拟病人程序,让医学生有更多机会通过和聊天机器人互动来练习采集病史的技能。同时,研究人员还通过分析聊天机器人给出的回答质量,来评估这种方法的可行性。


研究人员在这项研究中主要运用了以下关键技术方法:他们采用基于大语言模型的生成式 AI 技术,并借助韩国的 AI 平台 Naver HyperCLOVA X? 来实现虚拟病人与学生的交互。在开发过程中,通过不断进行内部测试,并利用医学专家编写的虚拟患者医学访谈脚本作为训练数据,对 AI 的回答进行微调优化。此外,研究人员邀请了专家进行评估,使用自行开发的包含相关性、准确性、流畅性、简洁性和有效性五个维度的问卷,采用五点李克特量表进行打分,以此来评价聊天机器人回答的质量。同时,运用话语分析的方法对聊天脚本进行分析,判断聊天机器人回答的合理性 。


下面来看看具体的研究结果。


  1. 对话内容产出:这次的试点测试收获了 96 对问答,聊天机器人总共生成了 177 个句子,字数达到 1325 个。从这些数据可以看出,聊天机器人在与学生的交流中,还是能 “说” 不少内容的。

  2. 不合理回答分析:在对聊天脚本进行话语分析时,研究人员发现聊天机器人给出的回答中,有 2.6%(34 个词)被认为不太合理。这些不合理回答主要分为三类:第一类是表达不清的回答,就像是说话没说完整,句子断断续续、重复或者只说了一部分,这类情况占比最多,有 1.7%(23 个词);第二类是幻觉,就是给出一些毫无意义、不准确甚至会误导人的信息,比如前面说自己在吃药,后面又说没吃,这类占 0.5%(7 个词);第三类是遗漏重要信息,比如没有完整回答医学生的问题,这类情况按句子数量算,占 0.3%(4 个句子)。

  3. 专家评价结果:参与评估的专家们对聊天机器人回答质量的总体评价还比较积极,平均得分达到了 3.96(标准差为 0.21)。具体来看,专家们认为回答在相关性(平均得分 4.50 ± 0.32)、有效性(平均得分 4.20 ± 0.40)和准确性(平均得分 4.10 ± 0.20)方面表现不错,在模拟医患交流的情境中比较靠谱。不过,专家们也指出,聊天机器人的回答在流畅性上还有所欠缺(平均得分 3.20,标准差为 0.60),和真实患者的回答相比,还是能听出一些 “机器感”。而且,专家们评价的一致性处于中等水平,组内相关系数(ICC)在 0.64 - 0.80 之间 。


从研究结论和讨论部分来看,这项研究意义重大。它表明基于大语言模型的生成式 AI 用于医学生练习采集病史是可行的。虽然聊天机器人的回答存在一些问题,但整体上还是比较合理的,这给未来在医疗教育中进一步应用生成式 AI 带来了希望。不过,为了让聊天机器人的回答更加真实自然,还需要不断改进。研究团队计划通过提供更多的训练数据来优化虚拟病人程序,让聊天机器人的回答更流畅。


此外,研究人员还在开发一个评估系统。这个系统能根据医学生与聊天机器人的完整聊天记录,分析他们遗漏的重要问题,并给出表现评分,为学生提供自动反馈。这一创新举措有望让虚拟病人程序的设计更加完善,模拟出更自然的医患对话场景。对于医学生来说,有了这个虚拟病人程序,他们不用再过度依赖标准化病人或真实患者,就能有更多机会练习采集病史的技能,还能通过 AI 技术获得结构化的反馈,提升自己的临床能力。而且,这个虚拟病人程序还可以和虚拟或增强现实环境相结合,让医学生在更真实的模拟场景中进行医患交流训练。


当然,这项研究也存在一些局限性。首先,这只是一个早期研究,主要是从教育者的角度评估了项目的可行性,还没有让医学生大规模参与。未来还需要开展更多研究,比如让医学生在不同场景下与聊天机器人互动,收集他们的反馈,了解这个项目的可用性以及学生的反应,同时评估学习效果。其次,这次试点只针对一种临床症状(泌尿系统问题)进行了研究,结果可能无法推广到其他临床情况。后续需要研究更多不同的临床场景,开发出涵盖更广泛病例的虚拟病人程序,同时还要探索如何更好地设置聊天机器人的提示和行为,让它在各种临床情境下都能有更好的表现。最后,目前 AI 平台多种多样,这次研究只用了一个平台,不同平台上 AI 的表现可能不一样。未来的研究需要探索这些研究结果在其他平台上是否同样适用,进一步提高 AI 在医疗教育中的应用效果。


总的来说,这项研究虽然只是一个开始,但它为生成式 AI 在医疗教育中的应用打开了一扇窗。随着研究的不断深入和技术的持续改进,相信在不久的将来,生成式 AI 会给医疗教育带来更多惊喜,培养出更优秀的医学人才。


婵犵數鍋為崹鍫曞箰閹间緡鏁勯柛顐g贩瑜版帒鐐婇柍瑙勫劤娴滈箖鏌i悢鐓庝喊婵℃彃婀遍埀顒冾潐閹稿摜鈧稈鏅濋埀顒勬涧閵堟悂寮崒鐐村€锋い鎺嶇劍閻﹀酣姊虹拠鎻掝劉缂佸甯″畷婵嬪箳濡も偓缁€澶愭煟閺冨倸甯舵潻婵囩節閻㈤潧孝婵炶尙濞€瀹曟垿骞橀幇浣瑰兊閻庤娲栧ú銊╂偩閾忓湱纾介柛灞剧懅椤︼附淇婇锝囩煉鐎规洘娲熼、鏃堝川椤栵絾绁梻浣瑰缁诲倿鎮ч幘婢勭喓鈧綆鍠楅悡娆愮箾閼奸鍤欐鐐达耿閺屾洟宕堕妸銉ユ懙閻庢鍣崜鐔肩嵁瀹ュ鏁婇柣锝呮湰濞堟悂姊绘担钘変汗闁烩剝妫冨畷褰掓惞椤愶絾鐝烽梺绉嗗嫷娈曟い銉ョ墦閺屾盯骞橀懠顒夋М婵炲濯崹鍫曞蓟閺囥垹骞㈡俊銈咃工閸撻亶鏌i姀鈺佺仭濠㈢懓妫楀嵄闁圭増婢橀~鍛存煟濞嗗苯浜惧┑鐐茬湴閸婃洟婀侀梺鎸庣箓濡瑧绮堢€n喗鐓冪憸婊堝礈濮橆厾鈹嶉柧蹇氼潐瀹曟煡鏌涢幇銊︽珖妞も晝鍏橀弻銊モ攽閸℃瑥鈪靛┑鈽嗗灠椤戝寮诲☉銏犵闁瑰鍎愬Λ锟犳⒑鐠囧弶鍞夊┑顔哄€楃划姘舵焼瀹ュ懐顦ㄥ銈嗘尵婵兘顢欓幒妤佲拺閻犲洠鈧櫕鐏侀梺鍛婃煥妤犳悂鍩㈤幘璇茬闁挎棁妫勫▓銉ヮ渻閵堝棛澧紒顔肩焸閸╂盯寮介鐔哄幈濠电偛妫欓崝鏇㈡倶閳哄偆娈介柣鎰级閸犳﹢鏌熼姘毙х€殿噮鍣e畷鎺懳旀担瑙勭彃

10x Genomics闂傚倷绀侀幖顐﹀磹閻熼偊鐔嗘慨妞诲亾妤犵偞鐗犻垾鏂裤€掓刊鐖剈m HD 闂佽瀛╅鏍窗閹烘纾婚柟鍓х帛閻撴洘鎱ㄥΟ鐓庡付闁诲繒濮烽埀顒冾潐濞叉粓宕伴幘鑸殿潟闁圭儤顨呴獮銏℃叏濮楀棗澧┑顔煎暣濮婃椽宕ㄦ繝鍌滅懆濠碘槅鍋呯划宥夊Φ閺冨牆绠瑰ù锝囨嚀娴犮垽姊洪幖鐐插姉闁哄懏绮撻幃楣冩焼瀹ュ棛鍘遍棅顐㈡搐椤戝懏鎱ㄩ埀顒€鈹戦悙瀛樼稇婵☆偅绮撴俊鐢稿箛閺夊灝宓嗛梺缁樶缚閺佹悂鎮℃担铏圭=濞达絽鎲″﹢鐗堜繆閻愯埖顥夐摶鐐烘煕瑜庨〃鍛矆閸℃稒鐓曢柍鈺佸暈缂傛岸鏌嶈閸忔稓鍒掑▎鎾虫瀬鐎广儱顦伴弲鎼佹煥閻曞倹瀚�

濠电姷鏁搁崑娑樜涙惔銊ュ瀭闁兼祴鏅滃畷鏌ユ倵閿濆骸浜為柍缁樻閹鏁愭惔鈥崇缂備椒鑳跺▍澧俰st闂傚倷绶氬ḿ褍螞濡ゅ懏鏅濋柨婵嗘川缁犳柨顭块懜闈涘婵☆偅蓱閵囧嫰骞樼捄杞扮捕缂傚倸绉崇欢姘跺蓟濞戙垹鍐€闁靛ě鍐f嫛婵犵數鍋涢悧濠囧储椤ョSPR缂傚倸鍊烽悞锔剧矙閹烘鍎庢い鏍仜閻掑灚銇勯幒鍡椾壕濡炪倧缂氶崡鎶藉箖瑜斿畷顐﹀Ψ閵堝棗濯伴梻渚€鈧偛鑻晶鏉戔攽閳ユ剚鍤熼柍褜鍓ㄧ紞鍡涘礈濮樿泛姹查柍鍝勬噺閸婂灚绻涢幋鐐垫噧濠殿喖鍟撮弻娑㈠籍閹炬潙顏�

闂傚倷绀侀幉锟犮€冮崱妞曞搫饪伴崨顓炵亰闂婎偄娲︾粙鎺楀吹閸曨垱鐓熼柟閭﹀墻閸ょ喖鏌曢崼鐔稿唉妤犵偞鐗犲鍫曞箣閻樻鍞堕梻浣告啞閻熴儱螞濠靛棭娼栧┑鐘宠壘鎯熼梺闈涱檧缁茬厧霉閻戣姤鐓熼柣妯夸含閸斿秶鎲搁弶鍨殻闁诡喓鍎甸弫鎾绘晸閿燂拷 - 濠电姷鏁搁崕鎴犲緤閽樺鏆︽い鎺戝閻鏌涢埄鍐$細妞も晜鐓¢弻娑㈠焺閸愭儳姣€闂佸湱鍎ら幐楣冦€呴悜钘夌閺夊牆澧界粔鐢告煕鎼淬垹鐏ラ柍钘夘樀楠炴﹢顢涘顐㈩棜婵犵數鍋為崹鍫曞箹閳哄倻顩叉繝濠傚暟閺嗭箓鏌i弮鍥仩缁炬儳銈搁弻娑㈠焺閸愵厼顥濋梺鍛婃⒐鐢繝骞冨Δ鍛嵍妞ゆ挾鍋樺Σ鎰版⒑缂佹ḿ鈯曢柣鐔濆洤绠悗锝庡枛缁犳煡鏌熸导瀛樻锭闁诡喕绶氬娲川婵犲倻顑傛繝鈷€鍕垫疁鐎殿喗濞婇幃銏ゆ偂鎼达綆鍞规俊鐐€栭弻銊╂倶濠靛牏鐜绘繛鎴欏灪閻撴瑩鎮归妸銉Ц闁稿﹤顭烽幃鐑藉閵堝棛鍘卞┑鐐叉閿氶柣蹇嬪劜閵囧嫰顢曢姀鈺佸壎閻庤娲滄繛鈧€殿喕绮欓、鏍敃閿濆懏璇為悗娈垮枟閹倿寮幘缁樻櫢闁跨噦鎷�

婵犵數鍋為崹鍫曞箰閹间緡鏁勯柛顐g贩瑜版帒鐐婃い鎺嗗亾鏉╂繃绻濋悽闈浶㈤悗姘煎櫍閹本鎯旈妸锔惧幘閻庤娲栧ú銈嗙濠婂牊鐓曢柣鎰摠鐏忥箓鏌熼挊澶娾偓濠氬焵椤掑﹦绉甸柛鎾村哺椤㈡棃濡舵径瀣化闂佽澹嬮弲娑欎繆閾忓湱纾奸柕濞у喚鏆梺鐟板槻閹冲酣銈导鏉戠闁靛ě鈧崑鎾寸節濮橆厾鍘搁柣搴秵閸嬪嫭鎱ㄩ崼銉︾厸鐎光偓閳ь剟宕版惔銊ョ厺闁哄啫鐗嗛崡鎶芥煟濡寧鐝慨锝呭閺岋絾鎯旈姀鈶╁闂佸憡姊圭敮鈥崇暦濠靛鍋勯柣鎾冲閵夆晜鐓ラ柣鏇炲€圭€氾拷

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号