人工智能设计的高功能基因组编辑器OpenCRISPR-1突破CRISPR-Cas9进化限制

【字体: 时间:2025年08月01日 来源:Nature 48.5

编辑推荐:

  本研究针对CRISPR-Cas系统在非原生环境中的功能局限性,通过大规模挖掘微生物组数据构建CRISPR-Cas Atlas数据库,并利用蛋白质语言模型(ProGen2)生成480万种新型CRISPR-Cas蛋白。研究人员成功开发出人工智能设计的基因编辑器OpenCRISPR-1,其与SpCas9序列差异达403个突变但具有相当的编辑效率,且脱靶率降低95%,同时兼容碱基编辑系统。该成果发表于《Nature》,为基因治疗提供了超越自然进化限制的新型工具。

  

基因编辑技术正深刻变革生命科学领域,但现有CRISPR-Cas系统存在显著局限性:天然效应蛋白如SpCas9在人类细胞中常表现功能折衷,存在脱靶效应、免疫原性等问题。传统蛋白工程方法如定向进化受限于崎岖的适应度景观,而基于结构的理性设计则依赖难以获取的复杂功能态结构信息。这些瓶颈促使科学家寻求突破自然进化限制的新范式。

Profluent Bio Inc的研究团队在《Nature》发表突破性研究,通过整合大规模数据挖掘与人工智能技术,开发出具有自主知识产权的新型基因编辑系统OpenCRISPR-1。该研究首先系统挖掘26.2 Tbp的微生物基因组数据,构建包含124.6万CRISPR-Cas操纵子的CRISPR-Cas Atlas数据库,其Cas9蛋白多样性是UniProt的4.1倍。基于此,团队采用多阶段建模策略:先预训练通用蛋白质语言模型ProGen2,再分别微调出CRISPR-Cas家族专用模型和Cas9特化模型,最终生成480万种新型CRISPR-Cas蛋白,使Cas9蛋白的系统发育多样性提升10.3倍。

关键技术包括:1) 建立CRISPR-Cas Atlas生物信息学管道;2) 开发条件生成式蛋白质语言模型;3) 设计配套sgRNA的序列到序列模型;4) HEK293T细胞编辑效率NGS检测;5) SITE-Seq全基因组脱靶分析。

LMs生成多样化CRISPR-Cas蛋白
通过AlphaFold2结构预测验证,81.65%生成蛋白具有可信结构,其中Cas9类蛋白完整保留HNH、RuvC核酸酶域等关键功能域。生成序列与天然蛋白平均相似度仅56.8%,但Foldseek分析显示其与SCOPe数据库结构元件匹配度与天然蛋白相当。

人工智能设计编辑器在人类细胞中的功能
从209个候选蛋白中筛选出的OpenCRISPR-1(PF-CAS-182)在HEK3等靶点显示与SpCas9相当的编辑效率(56.4% vs 47.1%),但脱靶率降低95%。SITE-Seq证实其切割位点为SpCas9的子集,且不与任何已知高保真变体共享突变位点。

OpenCRISPR-1的特性表征
该编辑器具有两大结构特征:REC1结构域的9个正电荷氨基酸插入可能稳定gRNA/DNA相互作用,HNH结构域的4残基插入可能维持切割检查点状态。在碱基编辑系统中,当与合成脱氨酶PF-DEAM-1/2组合时,A-to-G编辑效率达35-60%,与ABE8.20系统相当。

这项研究开创了人工智能设计功能性基因编辑器的先河,其核心突破在于:1) 证明语言模型可生成超越自然进化限制的活性核酸酶;2) 建立从序列生成到系统验证的完整流程;3) 开发的OpenCRISPR-1兼具高活性和低免疫原性。该技术路线可扩展至Cas12/13等其它CRISPR系统,为发展"按需定制"的基因编辑工具提供全新范式。研究释放的CRISPR-Cas Atlas资源和OpenCRISPR-1分子实体,将加速治疗性编辑器开发进程。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号