基于GPT-4的遗传性癌症综合征阳性筛查结果返回聊天机器人:检索增强生成与少样本提示工程的创新应用

【字体: 时间:2025年06月30日 来源:JMIR Cancer 3.3

编辑推荐:

  为解决遗传咨询资源不足与群体基因组筛查需求激增的矛盾,研究人员利用GPT-4开发了面向遗传性癌症综合征(如Lynch综合征、BRCA突变)阳性结果的聊天机器人。通过检索增强生成(RAG)和少样本提示工程技术,构建的聊天机器人在专家评估中取得平均3.86分(5分制),尤其在沟通语气(4.25分)和易用性(4.25分)表现突出。该研究为大规模基因组筛查项目(如南卡罗来纳州"In Our DNA SC"计划)提供了自动化结果返回的新范式,有望缓解遗传服务供需失衡问题。

  

随着群体基因组筛查(Population-wide Genomic Screening, PGS)项目的普及,遗传性癌症综合征(如BRCA1/2相关的遗传性乳腺癌卵巢癌综合征、MLH1相关的Lynch综合征)的阳性结果返回面临巨大挑战。南卡罗来纳州"In Our DNA SC"计划已为33,000余人返回结果,其中检出132例Lynch综合征、265例遗传性乳腺癌卵巢癌综合征和191例家族性高胆固醇血症。传统遗传咨询模式难以应对如此大规模的需求,而现有数字解决方案多局限于规则型聊天机器人,无法处理开放式问题。这一矛盾催生了基于大语言模型(Large Language Model, LLM)的智能解决方案需求。

Medical University of South Carolina的研究团队创新性地将GPT-4 Turbo模型应用于遗传性癌症阳性结果返回场景。研究采用三步提示工程策略:首先通过检索增强生成(Retrieval-Augmented Generation, RAG)技术整合遗传咨询脚本、常见问题解答等专业资料;其次建立包含27个临床问题的训练集;最后迭代优化提示模板。评估阶段,8名基因组学专家对2个典型病例(34岁BRCA1阳性女性和56岁MLH1阳性男性)的14个问题响应进行评分,使用5级Likert量表从8个维度评估性能。

最终提示和示例响应
优化后的提示明确限定聊天机器人角色为"遗传测试结果解释助手",要求使用五年级词汇水平并以项目符号形式回应。例如针对"预防性护理建议"的查询,机器人能系统列出MLH1突变携带者的结肠镜监测方案(每1-2年)、生活方式建议(戒烟、健康饮食)和预防性手术选项,同时强调需与医疗团队讨论个性化方案。

提示工程评估
专家评分显示,聊天机器人在语气(4.25±0.68)和易用性(4.25±0.58)表现最优,边界管理(4.0±0.73)和效率(3.88±1.09)次之。领域准确性(3.63±0.96)达到满意水平,但项目特定信息准确性(3.25±1.39)有待提升,如对"In Our DNA SC"计划细节的解释存在不足。值得注意的是,模型对模糊问题的处理能力(稳健性3.81±0.66)显著优于传统规则型系统。

讨论与展望
该研究证实LLM在遗传咨询场景的应用潜力,特别是在处理开放式查询时展现的灵活性。与既往规则型系统相比,GPT-4基模型能更自然地讨论家族遗传风险、更新科研进展等复杂话题。研究团队建议采用混合架构:关键信息(如项目介绍、基础医学知识)采用规则型模块确保准确性,个性化咨询则交由LLM处理。未来需扩大测试范围至更多基因型(如APC、TP53),并纳入患者视角评估文化适应性。

这项发表于《JMIR Cancer》的研究为基因组医学领域提供了重要范式——通过精心设计的提示工程,通用LLM可转化为专业遗传咨询助手。随着PGS项目全球推广,这种结合人工智能与人类专业知识的混合模式,或将成为解决遗传服务可及性问题的关键突破。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号