基于深度学习和多MSA策略的CASP16替代构象预测与结构聚类研究

【字体: 时间:2025年09月29日 来源:Proteins: Structure, Function, and Bioinformatics 2.8

编辑推荐:

  来自全球的研究人员通过EnsembleFold流程,结合DeepMSA2和rMSA生成多序列比对,利用D-I-TASSER2、DMFold2、ExFold及DeepProtNA等深度学习方法预测蛋白质、RNA及复合物结构,并通过MolClust聚类和REMC模拟提升构象多样性。最终在CASP16的19个靶点上平均TM-score达0.657,较AlphaFold3提升10.2%,显著推动了替代构象识别与复杂生物分子结构研究。

  
研究人员在CASP16中通过“MIEnsembles-Server”和“Zheng”团队应用EnsembleFold流程开展替代构象预测研究。首先利用DeepMSA2(蛋白质)和rMSA(RNA)生成多序列比对(MSA),随后通过深度学习工具——D-I-TASSER2(蛋白质单体结构预测)、DMFold2(蛋白质复合物结构预测)、ExFold(RNA结构预测)和DeepProtNA(蛋白质-核酸复合物结构预测)——产生多样化结构 decoys。通过结构聚类工具MolClust将decoys聚类为代表不同构象状态的模型,蛋白质单体靶标还经副本交换蒙特卡洛(REMC)模拟结合D-I-TASSER2进行细化,并重新聚类以完成 ensemble 预测。在CASP16的19个 ensemble 靶标中,EnsembleFold模型平均TM-score达到0.657,较基线AlphaFold3程序提升10.2%,尤其在蛋白质/核酸杂交靶标上表现突出。分析表明:(i)基于不同DeepMSA2生成MSA的模型通常代表不同构象状态;(ii)REMC模拟显著增强模型多样性,助力替代构象识别;(iii)结构聚类方法有效筛选各构象状态的精确代表模型。研究还讨论了质量评估(QA)评分方法的改进潜力,以提升未来 ensemble 预测的可靠性与准确性。利益冲突声明:L.F.为CircNova公司科学顾问委员会成员兼付费顾问,但该公司未参与本工作的资助、设计、执行或解释,且本手稿不直接用于或关联其 ongoing 工作。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号