
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于深度学习和AlphaFold 3的功能调控RNA设计新策略
【字体: 大 中 小 】 时间:2025年08月17日 来源:Briefings in Bioinformatics 7.7
编辑推荐:
本研究针对RNA分子在基因编辑中结构-功能关系复杂的设计难题,开发了整合深度学习和能量计算的计算框架sgRNAGen。通过Transformer架构生成多样化sgRNA序列,结合AlphaFold 3结构预测筛选,实现了最高75%的基因敲除效率和100%的大片段删除效率。该工作为CRISPR系统非天然sgRNA设计提供了新范式,并证实蛋白-RNA界面结构稳定性是功能关键。
RNA作为生命体的核心调控分子,其功能实现依赖于复杂的三维结构动态变化。在CRISPR/Cas9基因编辑系统中,单链引导RNA(sgRNA)如同"分子导航仪",指导Cas9蛋白精准定位目标DNA。然而,传统sgRNA设计面临两大瓶颈:一是天然sgRNA序列多样性有限,难以满足多基因编辑需求;二是RNA-蛋白质相互作用动态性导致结构预测困难,使得理性设计举步维艰。
北京航空航天大学航天中心医院消化内科与北京理工大学生命学院联合团队在《Briefings in Bioinformatics》发表创新成果。研究人员开发了名为sgRNAGen的深度学习模型,该模型采用Transformer架构,通过46,003条crRNA序列训练,结合马尔可夫链蒙特卡洛(MCMC)采样优化,生成具有功能多样性的sgRNA变体。研究团队进一步引入AlphaFold 3(AF3)进行结构预测筛选,发现界面预测TM-score(ipTM)可作为功能活性指标。通过分子动力学(MD)模拟揭示,REC结构域与sgRNA的相互作用稳定性是编辑效率的关键决定因素。
关键技术方法包括:1)基于Transformer的自回归生成模型构建;2)结合RNAfold的二级结构约束采样;3)AF3预测的ipTM和pTM评分系统;4)1.8微秒时长的全原子分子动力学模拟;5)使用枯草芽孢杆菌secY基因的生长选择系统进行功能验证。
生成模型验证
通过比较限制性采样与自回归生成方法,发现前者能更好保持sgRNA特征结构。实验验证50条设计序列中,8条保持>80%编辑效率,A49变体达到75%敲除效率。线性判别分析(LDA)鉴定出22、34等关键位点,其中环区突变表现出较高耐受性。
AF3预测效能
AF3预测显示,sgRNA-Cas9界面ipTM与实验活性显著相关(AUROC=0.67)。设定ipTM>0.85和RMSD≤1?的筛选标准后,F1-F9变体均实现100%切割效率。例外变体A13的MD模拟揭示其REC结构域结合不稳定性,印证了动态相互作用的重要性。
应用验证
在169.5kb大片段删除实验中,设计sgRNA组合效率达100%,显著优于单sgRNA系统。多基因编辑(nprE+uprA)联合效率达62.5%。利用失活SpRY(dSpRY)蛋白构建的CRISPRi系统,实现34.6-73.4%的梯度基因抑制。
该研究建立了"序列生成-结构筛选-动态验证"的RNA设计新范式。创新性体现在三方面:首先,sgRNAGen模型突破了天然序列限制,生成变体与原型序列差异达40%仍保持功能;其次,证实AF3预测可替代部分实验筛选,将设计周期从数月缩短至数天;最后,揭示的REC-sgRNA相互作用机制为后续优化提供新靶点。这些发现不仅推动CRISPR工具开发,更为设计调控RNA-蛋白质相互作用的 therapeutics 奠定基础。


生物通微信公众号
知名企业招聘