基于结构熵引导的信息瓶颈的分布外泛化图谱

《ACM Transactions on Knowledge Discovery from Data》:Graph Out-of-Distribution Generalization based on Structural Entropy guided Information Bottleneck

【字体: 时间:2025年11月08日 来源:ACM Transactions on Knowledge Discovery from Data

编辑推荐:

  开放世界下图神经网络(GNN)的泛化能力受冗余拓扑信息干扰,本文提出OOD-SEIB框架通过结构熵引导的信息瓶颈压缩模块,量化输入图与提取子图的结构信息差异(压缩指数),迭代优化子图拓扑的信息量和标签相关性,并结合多环境增强与知识蒸馏提升不变子图提取能力。实验表明在合成及三个真实图级OOD基准测试中,分类准确率平均提升4.85%-38.03%,节点级测试提升14.52%-13.15%。

  

摘要

分布外(OOD)泛化是一个具有前景但充满挑战的目标,它能够确保图神经网络(GNNs)在开放世界环境中的测试性能。然而,由于图结构数据的复杂内部拓扑,来自虚假拓扑的冗余信息会严重干扰GNNs,导致它们偏离真实标签。从原始图中提取简洁且与标签相关的子图可以缓解这一问题。不幸的是,现有方法要么忽略了全局结构分布,要么过分依赖预先定义的假设。因此,它们无法准确捕捉输入图与提取子图之间的结构分布变化,从而影响了提取出的不变子图对多种OOD场景的适应性。这促使我们提出了一个名为“结构熵引导的信息瓶颈(OOD-SEIB)”的框架,该框架旨在更可追溯地测量内在信息的变化,以实现更好、更灵活的OOD泛化。OOD-SEIB的核心是一个简洁的拓扑提取模块,我们基于结构熵(称为压缩指数CI)来衡量输入图与提取子图之间的互信息流动。具体来说,CI是一个可量化的指标,用于计算通过有偏随机游走来描述整个图结构所需的码字长度。在这一指导下,OOD-SEIB随后启动了一个结构信息瓶颈压缩模块,通过迭代平衡信息量和压缩性来共同优化子图拓扑的标签相关性。为了进一步提高GNN的不变子图识别能力,OOD-SEIB生成多个增强环境,并以自内而外的方式将不变子图转化为GNN的知识。通过上述规定的迭代优化方法,OOD-SEIB逐步强化了不变子图的提取能力,从而提升了其泛化能力。在合成数据和三个真实世界图级OOD基准测试中的广泛实验表明,与最先进的基线方法相比,我们提出的OOD-SEIB平均提高了4.85%-38.03%的分类准确率。此外,我们将OOD-SEIB扩展到了两个节点级基准测试中,平均分类准确率分别提高了14.52%13.15%
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号