基于Hodge-Laplacian算子的异质图注意力网络(HL-HGAT):面向高阶拓扑结构的图神经网络新框架

《IEEE Transactions on Pattern Analysis and Machine Intelligence》:HL-HGAT: Heterogeneous Graph Attention Network via Hodge-Laplacian Operator

【字体: 时间:2025年11月19日 来源:IEEE Transactions on Pattern Analysis and Machine Intelligence 18.6

编辑推荐:

  本文推荐一种基于Hodge-Laplacian算子的异质图注意力网络(HL-HGAT),该研究针对传统图神经网络(GNN)难以处理节点、边及高阶单形(k-simplex)间异质信号交互的瓶颈,提出通过HL算子构建谱域卷积滤波器、设计单形投影(SP)算子实现跨维度信号交互,并开发单形注意力池化(SAP)机制实现多尺度特征聚合。实验证明HL-HGAT在组合优化(如旅行商问题)、图像分类、分子性质预测及脑网络分析等任务中均优于现有GNN模型,为复杂图结构数据分析提供了通用且可解释的解决方案。

  
在当今数据驱动的科学研究中,图结构数据已成为描述复杂系统关系的重要载体,从社交网络、分子结构到脑功能连接,图模型无处不在。传统图神经网络(GNN)虽在节点级特征学习上取得显著进展,但其核心局限在于仅聚焦于节点间消息传递,难以捕捉边、三角形等高维拓扑结构(称为k-单形)中蕴含的异质信号。现实中,许多关键信息恰恰存在于这些高阶交互中:例如分子中化学键的振动模式、脑网络中功能连接边的动态特性,乃至图像中超像素边界的轮廓特征。如何突破节点中心范式的束缚,构建能够统一处理多维度图信号的通用框架,成为图学习领域亟待解决的核心挑战。
针对这一难题,新加坡国立大学黄靖汉团队联合福建农林大学、威斯康星大学麦迪逊分校等机构,在《IEEE Transactions on Pattern Analysis and Machine Intelligence》上发表了题为“HL-HGAT: Heterogeneous Graph Attention Network via Hodge-Laplacian Operator”的研究论文。该研究创新性地将图视为包含节点(0-单形)、边(1-单形)、三角形(2-单形)等结构的单形复合体(simplicial complex),引入拓扑学中的Hodge-Laplacian(HL)算子构建谱域卷积滤波器,并设计跨维度信号交互与池化机制,实现了对异质图结构数据的多尺度感知与可解释建模。
为突破传统GNN的维度限制,研究团队设计了三大核心技术模块:首先,基于k阶HL算子 Lk=?k+1?k+1?+?k??k(其中?k为k阶边界算子)构建HL滤波器,通过Laguerre多项式逼近实现计算效率与空间局部性的平衡。如图2(a)-(b)所示,该滤波器可有效捕捉节点和边上的脉冲信号在拓扑空间的传播特性。其次,通过单形投影(SP)算子TkTk实现k1-单形与k2-单形间的信号映射,为跨维度交互提供数学基础。图2(c)-(d)展示了节点与边信号通过SP算子的相互转换过程。最后,提出单形注意力池化(SAP)机制,融合自注意力与跨注意力计算单形重要性权重,并基于Graclus聚类算法实现拓扑保持的图粗化,如图3(b)-(c)所示。
在技术实现层面,研究团队采用多项式逼近降低HL算子的特征分解计算开销,利用Transformer架构构建注意力权重矩阵,并通过边界算子迭代更新保障高阶单形在池化过程中的拓扑一致性。模型在PyTorch框架下开发,基于ABCD(n=7,693)、OASIS-3(n=1,978)等脑影像数据集,CIFAR10图像数据集及ZINC、Peptide-func分子数据集进行验证,所有实验均采用ADAM优化器与标准化训练策略。

模型架构设计与理论基础

HL-HGAT的核心创新在于将Hodge-Laplacian理论引入图神经网络建模。通过定义k阶边界算子?k(如图1(b)所示),构建反映k-单形与(k-1)-单形关联的拓扑结构,进而推导出k阶HL算子Lk。该算子的特征分解为图信号提供了谱域变换基础,使卷积操作可表示为x(?)=p=0P?1θpTp(Lk)x(?),其中Tp为p阶Laguerre多项式。这种设计使得滤波器权重仅通过多项式系数θp学习,避免了显式特征分解的计算瓶颈。

多维度信号交互机制

为突破单维度滤波的局限,研究团队提出多单形交互(MSI)层,通过SP算子实现跨维度特征融合。具体地,将k1-单形信号Xk1与k2-单形信号Xk2经投影后拼接,通过全连接层学习交互表征:X~k1=ReLU((Xk1Tk2k1Xk2)Wk1)Wk1。该机制使得节点信号可吸收边信号的特征,反之亦然,形成多维互补的信息聚合通路。

拓扑感知的池化策略

SAP模块通过注意力权重矩阵Ak(融合自注意力与跨注意力)指导图粗化过程。以节点聚类为起点,利用边界算子迭代更新高阶单形分配矩阵Bk(如图1(c)),确保池化后拓扑结构的一致性。注意力权重的可视化结果(图7)表明,该机制能自动聚焦于任务相关特征:在图像分类中突出物体轮廓,在脑年龄预测中识别海马-杏仁核连接等关键生物标志物。

跨领域任务性能验证

在旅行商问题(TSP)中,HL-HGAT将路径优化转化为边分类任务,其F1分数显著优于GCN、GAT等基线模型(p<0.001),图5(a)的特征空间可视化显示模型能清晰分离最短路径边与非路径边。在CIFAR10图像分类任务中,基于超像素构图的HL-HGAT达到89.7%准确率,较GPS图Transformer提升约3.2%。分子性质预测任务进一步验证了模型的通用性:在ZINC数据集上约束溶解度的预测误差(MAE=0.063±0.004)低于所有对比模型,且特征聚类揭示出与合成可及性评分相关的隐藏维度(图5(d))。脑网络分析任务中,HL-HGAT对ABCD数据集一般智力的预测误差(MAE=5.291)显著优于BrainGNN(p<0.01),其注意力图谱成功识别前额叶-顶叶连接等认知相关环路(图7(c))。

计算效率与可扩展性分析

尽管高阶单形操作会增加计算复杂度,但多项式逼近与池化机制使HL-HGAT在稀疏图上仍保持O(n0)的线性复杂度。如图9所示,在节点数达1,118的脑网络上,模型性能与268节点网络相当,且内存占用优于同类边缘建模方法(如Hypergraph NN)。消融实验(图8)进一步证实:融合HL滤波器、MSI与SAP的完整模型(M4)在多数任务中性能最优,但对于小图(如ZINC分子)或边级预测任务(如TSP),简化架构(M3)即可满足需求。
本研究通过将微分几何与拓扑学工具深度融入图神经网络,构建了能够统一处理节点、边及高阶单形的通用框架。HL-HGAT不仅在多领域任务中实现性能突破,其注意力机制更提供了可解释的拓扑特征标识,为生物医学图像分析、药物发现与脑科学等领域提供了新的分析范式。未来工作可探索动态图上的HL算子演化规律,以及针对超大规模图的近似池化算法,进一步拓展该框架在时空数据建模中的应用潜力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号