
-
生物通官微
陪你抓住生命科技
跳动的脉搏
高效并行分析人类细胞中24种Cas12a变体的活性与特异性——为精准基因编辑提供新工具
【字体: 大 中 小 】 时间:2025年03月29日 来源:Nature Communications 14.7
编辑推荐:
《自然·通讯》推荐语:针对Cas12a变体选择困难的问题,中国研究团队通过高通量分析系统评估了24种Cas12a变体的PAM兼容性和编辑活性,开发了深度学习模型enDeepCpf1预测编辑效率,并改进GUIDE-seq技术为enGUIDE-seq,揭示了不同变体的脱靶效应和染色体易位特征,为临床基因治疗提供重要参考。
基因编辑技术CRISPR-Cas系统自问世以来彻底改变了生命科学研究格局,其中Cas12a(旧称Cpf1)因其独特的T-rich PAM识别特性、单crRNA引导机制和交错切割模式,在多重基因编辑和临床治疗中展现出独特优势。然而随着工程化改造的深入,科学家们已开发出数十种具有不同PAM兼容性、编辑效率和特异性的Cas12a变体,如enAsCas12a-HF1(扩展靶向范围)、AsCas12a Ultra(高效型)和HyperFi-AsCas12a(高保真型)。面对如此丰富的"基因剪刀库",研究者们陷入选择困境——如何为特定靶序列快速匹配最优Cas12a变体?传统方法需逐个测试,耗时费力且难以系统评估脱靶风险。更棘手的是,现有GUIDE-seq技术在检测Cas12a诱导的双链断裂时,会因核酸酶持续切割作用导致标记序列(dsODN tag)截断,造成脱靶位点漏检。
为解决这些关键问题,武汉大学的研究团队在《自然·通讯》发表了突破性研究成果。他们建立了包含11,968对向导RNA-靶序列组合的四大文库系统,通过高通量平行分析比较了24种Cas12a变体(涵盖As/Lb/Fn/Eb等天然型及工程改造型)在HEK293T细胞中的编辑效率,绘制出不同PAM序列下的活性图谱。研究还创新性开发了增强版enGUIDE-seq技术,通过优化标记引物设计解决了传统方法的截断问题,并系统评估了各变体的脱靶效应和染色体易位风险。基于海量数据训练的深度学习模型enDeepCpf1,可准确预测不同变体在特定靶点的编辑效率,为精准基因编辑提供智能导航。
关键技术方法包括:1)构建四组靶序列文库(含15类PAM变体)的HEK293T细胞模型;2)多MOI梯度下的Cas12a变体活性高通量筛选;3)卷积神经网络构建的seq-DeepCpf1variants和enDeepCpf1预测模型;4)改进型enGUIDE-seq全基因组脱靶检测;5)Western blot验证蛋白表达一致性。
通过标准化文库系统发现:对于经典TTTV PAM,突变体mut2C-W编辑效率最高(74.5%),而CeCas12a仅识别TTTV且活性中等(55.5%)。扩展型变体表现突出——enAsCas12a-HF1可识别全部15种PAM,LbCas12aRVRR兼容14种PAM。有趣的是,5'端核苷酸显著影响活性,如AsCas12a变体对C起始的CTCV PAM效率比A/G/T起始高3倍。
首次系统绘制各变体的PAM偏好:enEbCas12a在CTCV/GTTV等PAM下效率达54.3%,而LbCas12aRR对CCCVPAM展现超强活性(64%)。工程化变体突破天然限制——AsCas12aRVR可高效编辑TATVPAM(53%),FnCas12aRVR将识别范围扩展至TATM。
开发的seq-DeepCpf1variants模型在测试集表现优异(Pearson r=0.86),整合染色质可及性信息的enDeepCpf1进一步提升预测精度,在独立验证集中相关系数达0.83,显著优于现有工具DeepGuide和CRISPR-DT。
改进技术使标记序列检出率提升5倍。保真型变体HyperFi-AsCas12a特异性评分最高(0.7),而高效型HyperLbCas12a仅0.14。出乎意料的是,染色体易位频率与活性/特异性无显著相关性,提示易位机制复杂。
这项研究构建了迄今为止最全面的Cas12a变体"性能数据库",其创新性体现在三个方面:技术层面,enGUIDE-seq解决了Cas12a脱靶检测的技术瓶颈;理论层面,揭示了不同结构域改造(如WED-II区突变)对PAM兼容性的调控规律;应用层面,开发的预测模型可快速匹配"最佳变体-靶点"组合。对于遗传病治疗,研究提示选择LbCas12a K538R等变体可平衡效率与安全性;而需要多重编辑时,enAsCas12a-HF1的广谱PAM识别能力更具优势。未来,该团队计划将平台扩展至原代细胞和动物模型,进一步推动Cas12a变体在基因治疗中的精准应用。
生物通微信公众号
知名企业招聘