就在大家为这些问题发愁的时候,生成式人工智能(AI)技术带着它的 “超能力” 闪亮登场了。像 ChatGPT 这样的人工智能,凭借着强大的大语言模型(LLM)和自然语言处理能力,似乎为医学教育带来了新希望。它能实现更真实、自然的互动,就像给虚拟病人注入了 “灵魂”,让医学生和虚拟病人的对话变得更像和真实患者交流。不少研究也发现,生成式 AI 能提供模拟患者体验,给出大部分合理的答案,还能自动给出结构化反馈,用户体验也不错。
不过,生成式 AI 在医学教育领域,尤其是在帮助医学生练习病史采集方面,还处于起步阶段。一方面,大家不确定它生成的回答是否适合用于练习病史采集,毕竟 AI 有时会 “脑洞大开”,产生一些幻觉,给出一些不符合实际情况的答案,或者带有偏见。另一方面,目前关于 AI 在医学教育中可衡量的教育成果的证据还很少,而且聊天机器人在不同临床场景中的通用性也有待探索。这就好比 AI 是一辆刚造出来的新车,大家知道它有潜力,但不知道它在各种复杂路况下能不能跑得稳、跑得好。
在这样的背景下,韩国某学术医学中心人工智能医疗研究小组的研究人员,为了解决这些难题,在《BMC Medical Education》期刊上发表了一篇名为《Design and development of a virtual patient program using generative artificial intelligence technology: a pilot feasibility study》的论文。他们想看看,用生成式 AI 技术设计开发虚拟病人程序,帮助医学生练习病史采集,到底可不可行。
为了开展这项研究,研究人员主要用到了以下几个关键技术方法:他们借助基于大语言模型的生成式 AI 技术,选择了韩国的 AI 平台 Naver HyperCLOVA X? 来打造虚拟病人。在开发过程中,通过不断进行内部测试,用专家编写的虚拟患者医疗访谈脚本作为训练数据,对 AI 的回答进行微调。另外,他们邀请了包括 AI 专家和医学教育者在内的 5 位研究人员,让他们扮演医学生和虚拟病人互动,之后用专门设计的问卷对 AI 的回答质量进行评价。同时,还运用了话语分析的方法,对互动脚本进行深入分析。
从这次研究的结果来看,研究人员得出结论:使用基于大语言模型的生成式 AI 进行虚拟病人病史采集练习是可行的。虽然聊天机器人的回答存在一些小问题,但总体上比较合理,得到了研究人员的认可。这一结论意义重大,它为医学教育中使用生成式 AI 技术提供了初步的可行性依据。以前大家对 AI 在这方面的应用还心存疑虑,现在这个研究就像一颗 “定心丸”,让人们看到了 AI 在医学教育领域的潜力。
其次,这次只是用了一个泌尿系统问题的虚拟病人案例进行测试,不能代表其他临床案例的情况。毕竟医学领域的病症多种多样,就像一个庞大复杂的迷宫。所以,还需要研究不同临床场景下 AI 工具的适用性,开发出涵盖更多临床案例的虚拟病人项目。而且开发这样的项目很耗费资源,研究人员建议医学院校之间加强合作,一起分享资源,打造一个全面的虚拟病人案例库。
最后,现在市面上有很多 AI 平台,这次研究只用了其中一个。不同平台的 AI 回答质量可能不一样,以后的研究还得看看这次的研究结果能不能推广到其他平台,怎样让 AI 在不同平台上都能有更好的表现。
总的来说,这项研究虽然有不足,但它就像一盏明灯,为医学教育和生成式 AI 技术的结合指明了方向。随着研究的不断深入和技术的持续进步,相信在未来,生成式 AI 会在医学教育中发挥更大的作用,帮助培养出更多优秀的医生,为人们的健康保驾护航。