基于基序中心的多粒预处理和微调策略的分子性质预测

《IEEE Transactions on Computational Biology and Bioinformatics》:Molecular Property Prediction Based on Motif-Centric Multi-Grain Pretaining and Finetuning Strategy

【字体: 时间:2025年11月13日 来源:IEEE Transactions on Computational Biology and Bioinformatics

编辑推荐:

  分子属性预测中,现有多级GNN方法在基团与原子层级关系处理及多粒度信息融合上存在不足。本文提出MMGSF框架,包含基团中心多粒度预训练策略MMGS和跨注意力mol-adapter微调模块MGF,有效整合分子多粒度信息,实验验证其显著提升属性预测精度。

  

摘要:

分子属性预测对于推进医学研究(如逆合成分析和药物发现)至关重要。获取准确的分子属性标签是一个挑战,这促使人们使用了具有自监督学习方法的多层预训练图神经网络(GNNs)。然而,这些多层方法未能充分处理分子图不同层次之间的关系,尤其是在基序和原子层面,并且忽略了不同“颗粒”之间的融合方式。为了克服这些限制,我们提出了以基序为中心的多颗粒图预训练和微调策略框架(MMGSF)。该框架包含两个组成部分:以基序为中心的分子图预训练策略(MMGS),它专注于在多层图上进行基于基序的对比学习,同时不破坏分子结构;以及多颗粒微调(MGF),该策略通过使用一种新颖的mol-adapter模块和跨注意力机制来细化不同“颗粒”之间的节点表示,从而实现自适应特征融合。我们的MGF能够捕捉复杂的特征相互作用,确保来自不同“颗粒”的结构和语义信息有效地贡献于分子属性预测。在分子属性分类任务中取得的优异结果表明了MMGSF的有效性,其可视化性能也表明,学习到的表示能够成功捕获分子的多颗粒信息和属性。这项研究为设计更有效的分子属性预测自监督学习框架提供了新的见解。

引言

作为物质的基本组成部分,分子表示学习在科学探索和医学研究中发挥着关键作用,特别是在逆合成分析[1]和药物发现[2]等领域。为了保持分子结构的完整性,将分子表示为图是一个可行的方法,在这种表示中,节点代表原子,边代表化学键。近年来,基于图神经网络(GNNs)及其变体的研究在分子属性预测方面取得了显著成就。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号