基于深度学习和多MSA策略的CASP16替代构象预测与结构聚类研究
【字体:
大
中
小
】
时间:2025年09月29日
来源:Proteins: Structure, Function, and Bioinformatics 2.8
编辑推荐:
来自全球的研究人员通过EnsembleFold流程,结合DeepMSA2和rMSA生成多序列比对,利用D-I-TASSER2、DMFold2、ExFold及DeepProtNA等深度学习方法预测蛋白质、RNA及复合物结构,并通过MolClust聚类和REMC模拟提升构象多样性。最终在CASP16的19个靶点上平均TM-score达0.657,较AlphaFold3提升10.2%,显著推动了替代构象识别与复杂生物分子结构研究。
研究人员在CASP16中通过“MIEnsembles-Server”和“Zheng”团队应用EnsembleFold流程开展替代构象预测研究。首先利用DeepMSA2(蛋白质)和rMSA(RNA)生成多序列比对(MSA),随后通过深度学习工具——D-I-TASSER2(蛋白质单体结构预测)、DMFold2(蛋白质复合物结构预测)、ExFold(RNA结构预测)和DeepProtNA(蛋白质-核酸复合物结构预测)——产生多样化结构 decoys。通过结构聚类工具MolClust将decoys聚类为代表不同构象状态的模型,蛋白质单体靶标还经副本交换蒙特卡洛(REMC)模拟结合D-I-TASSER2进行细化,并重新聚类以完成 ensemble 预测。在CASP16的19个 ensemble 靶标中,EnsembleFold模型平均TM-score达到0.657,较基线AlphaFold3程序提升10.2%,尤其在蛋白质/核酸杂交靶标上表现突出。分析表明:(i)基于不同DeepMSA2生成MSA的模型通常代表不同构象状态;(ii)REMC模拟显著增强模型多样性,助力替代构象识别;(iii)结构聚类方法有效筛选各构象状态的精确代表模型。研究还讨论了质量评估(QA)评分方法的改进潜力,以提升未来 ensemble 预测的可靠性与准确性。利益冲突声明:L.F.为CircNova公司科学顾问委员会成员兼付费顾问,但该公司未参与本工作的资助、设计、执行或解释,且本手稿不直接用于或关联其 ongoing 工作。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号