
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:人工智能革命化CRISPR技术
【字体: 大 中 小 】 时间:2025年08月01日 来源:Experimental & Molecular Medicine 9.5
编辑推荐:
这篇综述系统阐述了人工智能(AI)如何通过机器学习(ML)和深度学习(DL)优化CRISPR技术,包括核酸酶(Cas9/Cas12a)、碱基编辑器(CBE/ABE/CGBE)和先导编辑器(PE)的设计与预测。AI通过分析高通量数据提升gRNA活性预测、降低脱靶效应,并辅助发现新型Cas蛋白(如OpenCRISPR-1),为基因治疗提供更精准、安全的工具。
基因组编辑技术从锌指蛋白(ZFNs)和转录激活样效应因子(TALENs)发展到CRISPR-Cas系统,后者凭借gRNA引导的靶向性成为主流工具。然而,编辑效率的细胞类型差异和脱靶效应仍是重大挑战。人工智能(AI)通过分析海量实验数据,为这些难题提供了高阶解决方案。
gRNA设计:AI模型如Rule Set 1-3和DeepSpCas9通过分析数万条gRNA序列,识别影响活性的关键特征(如鸟嘌呤富集)。例如,DeepCRISPR同时预测gRNA的靶向效率和脱靶风险,而CRISPRscan在斑马鱼胚胎中验证了截短gRNA的适用性。
脱靶预测:Elevation和CRISPR-DIPOFF等工具利用梯度提升树(GBRT)和长短期记忆网络(LSTM)量化错配容忍度,平衡精确率与召回率。CRISOT进一步整合RNA-DNA相互作用指纹,提升预测精度。
蛋白工程:AlphaFold2预测Cas13的迷你化变体(仅原尺寸1/3),而生成式AI模型Evo设计出非天然Cas9蛋白OpenCRISPR-1,其在人类细胞中编辑效率超越SpCas9。
效率提升:BE-Hive和DeepBE分析38,538个靶点,发现序列上下文决定C→T或A→G转换效率。例如,eA3A-BE5通过突变(T44D+S45A)减少副产物,而CGBE-Hive指导546个致病SNVs的精准修复。
内源靶点优化:CAELM模型整合染色质可及性数据,显著提高BE4max在内源位点的预测准确性。BE_Endo进一步揭示转录活性对编辑效率的影响。
pegRNA设计:DeepPE和PRIDICT通过54,836组pegRNA-靶点对训练,预测插入/缺失效率。OPED结合迁移学习,为20亿个致病变异提供优化设计方案。
染色质环境影响:ePRIDICT整合MMR(错配修复)通路抑制策略,在异染色质区域仍保持高预测精度。MLH1-SB(AI设计的小结合蛋白)通过阻断MLH1将PE效率提升3倍。
尽管AI大幅降低了实验试错成本,但其性能仍受限于训练数据的质量和广度。未来,结合多组学数据和体内验证,AI驱动的CRISPR技术有望推动个性化基因疗法进入临床新纪元。
生物通微信公众号
知名企业招聘