CRISPR-GPT:基于大语言模型的基因编辑实验自动化AI协同系统

【字体: 时间:2025年07月31日 来源:Nature Biomedical Engineering 26.6

编辑推荐:

  本研究针对CRISPR基因编辑实验设计复杂、专业门槛高的问题,开发了CRISPR-GPT系统。该系统通过整合大语言模型(LLM)的推理能力与领域专业知识,实现了CRISPR-Cas系统选择、gRNA设计、实验方案生成等22项任务的自动化。研究团队成功在A549肺癌细胞中敲除TGFBR1等4个基因,并在黑色素瘤细胞中表观激活NCR3LG1等基因,首次尝试即获成功。该系统为生物医学研究提供了智能化的"AI副驾驶",显著降低了基因编辑技术的应用门槛。

  

基因编辑技术CRISPR-Cas9被誉为"基因剪刀",自2012年问世以来彻底改变了生命科学研究格局。然而,这项技术的实际应用仍面临巨大挑战:实验设计需要同时精通分子生物学、生物信息学和特定疾病模型的专业知识;现有软件工具往往只解决单一环节问题;新手研究人员常因设计失误导致实验失败。如何降低技术门槛,让更多研究者高效利用这一革命性工具,成为制约生物医学发展的关键瓶颈。

斯坦福大学(Stanford University)的研究团队在《Nature Biomedical Engineering》发表了一项突破性研究。他们创造性地将人工智能领域的大语言模型(LLM)与CRISPR基因编辑技术相结合,开发出名为CRISPR-GPT的智能实验设计系统。该系统通过多智能体协作架构,能够理解研究者的自然语言请求,自动分解实验任务,并提供从CRISPR系统选择到数据分析的全流程指导。

研究采用三大关键技术:1)构建包含LLM规划器、工具提供者和任务执行器的多智能体系统,支持Meta(分步引导)、Auto(自动规划)和Q&A(实时答疑)三种交互模式;2)整合CRISPick等权威数据库和Primer3等生物信息学工具;3)基于4000条科学家讨论记录微调出CRISPR-Llama3专业模型。实验验证使用A549肺腺癌细胞系和A375黑色素瘤细胞系。

AI协同系统架构
系统核心由四大组件构成:用户代理(User proxy)负责交互,LLM规划器(Planner)进行任务分解,任务执行器(Task executor)管理状态机流程,工具提供者(Tool provider)连接外部资源。这种模块化设计支持四种主要编辑模式:基因敲除(KO)、碱基编辑(base editing)、先导编辑(prime editing)和表观遗传编辑(CRISPRa/i)。

自动化实验设计性能
在包含288个测试案例的基因编辑评估集(Gene-editing bench)中,CRISPR-GPT的规划准确率超过99%。相比通用LLM,其在gRNA设计环节能智能推荐靶向功能域的关键外显子(如BRD4基因的Exon3-4),而传统工具CRISPick和CHOPCHOP设计的gRNA中87.5%靶向非必需区域。

真实世界验证
新手研究人员使用该系统成功完成两项实验:在A549细胞中敲除TGFBR1、SNAI1、BAX和BCL2L1四个基因,经NGS验证编辑效率达68-92%;在A375细胞中通过CRISPR-dCas9激活NCR3LG1和CEACAM1,流式细胞术检测显示激活效率分别达56.5%和90.2%。表型实验证实TGFBR1敲除使上皮-间质转化(EMT)标志物CDH1和VIM表达变化降低9-34倍。

这项研究标志着人工智能与实验生物学的深度融合。CRISPR-GPT的创新性体现在三个方面:1)首次实现从实验设计到数据分析的端到端AI指导;2)通过整合11年科学家讨论数据,使AI具备"科研思维";3)内置生物安全机制,防止人类生殖细胞编辑等伦理风险。研究团队Yuanhao Qu、Kaixuan Huang等强调,该系统不仅适用于CRISPR领域,其模块化架构为其他科学领域的AI协同系统开发提供了范式。随着自动化实验平台的发展,这种"人类提出假设-AI设计实验-机器人执行"的新科研模式,或将加速生命科学领域的发现速度。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号