一种混合集成端到端神经网络,用于精确预测蛋白质-蛋白质相互作用

《IEEE Transactions on Computational Biology and Bioinformatics》:A Hybrid Ensemble End-to-End Neural Network for Accurate Protein-Protein Interactions Prediction

【字体: 时间:2025年12月12日 来源:IEEE Transactions on Computational Biology and Bioinformatics

编辑推荐:

  蛋白质相互作用(PPIs)预测是生物医学研究的关键,传统模型存在特征提取碎片化、忽略全局关系等问题。本文提出HEENN模型,创新性地采用Graph Attention Network(GAT)精准提取局部拓扑语义特征,结合AutoEncoder架构系统捕获全局生物特征,并通过动态注意力机制实现多源特征自适应融合。实验表明HEENN在PPI预测精度上显著超越KGF-GNN等基线模型,为疾病机制解析和药物开发提供新工具。

  

摘要:

蛋白质-蛋白质相互作用(PPIs)对于理解细胞机制、信号网络、疾病途径和药物开发至关重要。多年来,人们开发了许多基于人工智能(AI)的计算模型来预测PPIs。然而,这些模型大多面临重大挑战,例如特征提取流程不完整、无法捕捉蛋白质之间的复杂全局关系,以及依赖手工制作的特征。这些挑战常常限制了它们的预测准确性。为了解决这些问题,提出了知识图谱融合图神经网络(KGF-GNN),它采用端到端的学习方法,将蛋白质关联网络(PAN)与观测到的PPI数据相结合。尽管KGF-GNN在性能上有所提升,但它主要关注图神经网络(GNNs)提取的局部拓扑特征,可能会忽略关键的全局模式。此外,其特征融合过程缺乏有效结合多种生物信息的灵活性。为了解决这些不足,本文介绍了一种混合集成端到端神经网络(HEENN),该网络包含了三项关键创新:(1)通过图注意力网络(GAT)进行局部特征提取:HEENN利用GAT更精确地提取局部拓扑和语义特征,使模型能够专注于数据中最相关的相互作用和关系;(2)通过AutoEncoder进行全局特征提取:借助AutoEncoder框架,HEENN从PANs和PPI数据集中捕获全面的全局特征,补充GAT的局部特征,从而产生更丰富的蛋白质表示;(3)注意力增强特征融合:在特征融合过程中采用注意力机制,确保局部特征和全局特征的自适应和有效整合。在真实世界的PPI数据集上的广泛实验表明,HEENN的性能显著优于KGF-GNN和其他模型...

引言

蛋白质是由氨基酸组成的有机大分子,是细胞的基本组成部分,维持着生命活动。它们在生物学中起着重要作用,通过将细胞的多种重要生理活动与PPIs联系起来[1],从而促进诸如细胞凋亡和免疫反应等一系列生命活动。蛋白质-蛋白质相互作用(PPIs)在细胞生命活动中起着关键作用,如转录调控、信号转导和药物信号转导。研究PPIs有助于我们理解细胞信号传导、疾病机制和药物开发[2]、[3]。许多药物通过靶向和干扰特定的蛋白质相互作用来发挥作用。因此,深入理解这些相互作用及其潜在机制对于设计更高效和有针对性的治疗策略至关重要。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号