DEERFold:基于双电子电子共振距离分布引导AlphaFold2预测蛋白质构象集合的新方法

【字体: 时间:2025年08月03日 来源:Nature Communications 15.7

编辑推荐:

  研究人员针对AlphaFold2在预测蛋白质多构象状态时的局限性,开发了DEERFold方法,通过将双电子电子共振(DEER)光谱获得的距离分布整合到AlphaFold2架构中,成功实现了对膜转运蛋白等多种蛋白质构象集合的精准预测。该研究为利用稀疏实验数据指导蛋白质结构预测提供了通用框架,显著提升了动态构象研究的效率。

  

在结构生物学领域,准确预测蛋白质的多种构象状态一直是重大挑战。虽然AlphaFold2在单构象预测方面取得突破,但其"单序列-单结构"的固有模式难以捕捉蛋白质动态变化的关键特征。这种局限性严重制约了其在研究酶催化、信号转导和药物转运等生物过程中的应用。特别是在膜转运蛋白研究中,构象变化与功能直接相关,传统方法需要耗费大量资源获取晶体或冷冻电镜结构。

为解决这一难题,范德堡大学(Vanderbilt University)的研究团队Tianqi Wu等人创新性地将实验数据与人工智能相结合。他们开发的DEERFold方法通过改造AlphaFold2网络架构,使其能够解读双电子电子共振(DEER)光谱获得的距离分布信息,成功实现了对蛋白质构象集合的精准预测。这项突破性研究发表在《Nature Communications》上,为结构生物学研究提供了新范式。

研究团队主要运用了三种关键技术:(1)基于OpenFold平台对AlphaFold2进行微调,使其能够处理DEER距离分布数据;(2)采用chiLife软件模拟旋转标记距离分布,优化约束条件选择;(3)建立地球移动距离(EMD)评估体系,在无实验结构时验证预测准确性。研究使用了包括PfMATE、LmrP和P-glycoprotein(Pgp)在内的多种膜转运蛋白作为测试系统。

【Modeling protein conformational ensembles】部分展示了DEERFold的核心创新。通过将DEER距离分布作为额外输入特征整合到Evoformer模块,该方法实现了实验数据与共进化信息的协同作用。与仅使用α碳距离的AlphaLink相比,DEERFold能更准确地处理旋转标记的构象自由度,解决了传统方法因侧链柔性导致的预测偏差问题。

【Spin label distance distributions fail as input for AlphaLink】部分通过对比实验凸显了方法优势。当直接将实验旋转标记距离输入AlphaLink时,PfMATE预测模型的RMSD误差达9.07?,LmrP的预测甚至出现结构紊乱(pLDDT仅64.35)。这些失败案例证实了专门开发DEERFold的必要性。

【Experimental DEER distance distributions guide AlphaFold2】部分验证了方法的有效性。在PfMATE测试中,使用原始实验数据(Experiment 1)使预测模型与目标构象的RMSD从5.19?降至2.11?;而采用单峰近似数据(Experiment 2)进一步将RMSD优化至1.32?。类似地,LmrP的构象转换成功率显著提高,证明DEERFold能有效利用实验数据引导构象选择。

【Optimized spin label pairs for conformational switching】部分揭示了约束条件的优化策略。通过Kazmier方法选择螺旋末端标记位点,仅需10对距离约束就能使PfMATE的预测RMSD达1.22?。特别值得注意的是,对LmrP仅使用2个优化约束,就有58%的模型成功转换构象,证明了方法的高效性。

【Application of DEERFold to Pgp】部分展示了方法在复杂系统中的应用。针对多结构域的ABC转运蛋白Pgp,DEERFold成功预测了其ADP-Vi结合状态(与实验结构RMSD 3.25?)和apo状态的不同构象。通过随机选择8个优化约束,约60%的预测模型能准确捕获目标构象,大幅减少了实验工作量。

【Earth mover distance score】部分建立了无晶体结构时的评估标准。通过主成分分析结合EMD评分,研究人员证明低EMD值与目标构象高度相关。如LmrP预测中,最低EMD值簇的模型与实验结构RMSD仅1.73?(TM-score=0.96),为实验设计提供了可靠指导。

【General performance】部分系统评估了方法的普适性。在29个测试蛋白中,DEERFold使89%的案例得到改善,42%的案例RMSD降低超过10%。尤其值得注意的是,对G0S4S9(2912个残基)仅需126个约束就能获得准确预测,证明了方法处理大分子的能力。

研究结论部分强调,DEERFold通过将生物物理实验数据与深度学习相结合,建立了蛋白质构象研究的通用框架。该方法具有三大创新点:(1)首次实现了DEER距离分布与AlphaFold2架构的深度融合;(2)所需实验数据量仅为传统方法的1/5;(3)建立的EMD评估体系解决了无晶体结构时的验证难题。这些突破不仅适用于DEER数据,还为整合NMR、FRET等其他生物物理技术奠定了基础,将推动动态结构生物学研究进入新阶段。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号