TRGH-PPI:通过Transformer和图模型实现蛋白质-蛋白质相互作用的有效且泛化的预测

《IEEE Transactions on Computational Biology and Bioinformatics》:TRGH-PPI: Effective and Generalized Prediction of Protein-Protein Interactions Through Transformer and Graph

【字体: 时间:2025年11月13日 来源:IEEE Transactions on Computational Biology and Bioinformatics

编辑推荐:

  蛋白互作预测的集成框架TRGH-PPI结合Transformer和图神经网络(GNN),通过迭代提取序列和结构特征,提出动态注意力机制的dpdGAT模块,实验表明其平均性能提升2%-5%。

  

摘要:

蛋白质-蛋白质相互作用(PPI)是生物系统中功能和信号传导的基本方式。随着实验性PPI研究需求的增加和成本的上升,需要计算工具来自动预测和理解PPI。然而,现有方法要么严重依赖蛋白质序列进行PPI预测,要么基于结构是相互作用关键决定因素的信念来关注蛋白质结构。但实际上,两者都对蛋白质的功能有重要影响。因此,我们提出了一个基于Transformer和GNN的集成框架TRGH-PPI,该框架包括一个蛋白质特征提取模块和一个PPI预测模块,能够同时建模这两种类型的蛋白质信息并预测PPI。在蛋白质特征提取模块中,我们反复使用Transformer和GCN来迭代更新蛋白质的序列表示和结构特征。Transformer和GCN的结合使它们能够发挥各自的优势,促进模型创新,并提高图数据处理的效率。在PPI预测模块中,我们提出了dpdGAT,它使用更适合PPI预测的点积运算,并具有动态注意力机制。大量实验表明,TRGH-PPI优于当前先进的方法,在预测PPI方面表现出高准确性和泛化能力。通过整合序列和结构特征的协同建模,该模型在三个数据集上的关键指标上平均提高了2%至5%。

引言

蛋白质-蛋白质相互作用(PPI)是生物研究中的核心课题,因为它们在各种细胞功能中起着关键作用,包括信号转导和代谢调节[1]。识别PPI对于理解蛋白质功能和疾病发生非常重要,这有助于发现治疗靶点[2]和设计新药物[3]。随着高通量实验技术的发展,研究人员现在可以识别和表征大量的PPI。诸如酵母双杂交(Y2H)[4]筛选和基于质谱的蛋白质复合物鉴定(MS-PCI)[5]等方法可以表征大规模的蛋白质相互作用网络,但错误率较高。亲和纯化富集质谱(AE-MS)[6]和基于测序的酵母双杂交(Y2H-seq)[7]显著降低了假阳性率。邻近标记技术如TurboID[8]和APEX2[9]可以快速标记相邻蛋白质。然而,这些方法的实验过程复杂、周期长且规模有限[10]。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号