
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多尺度交互注意力融合网络(MIAF-Net)在高光谱图像分类中的创新应用
【字体: 大 中 小 】 时间:2025年06月03日 来源:Expert Systems with Applications 7.5
编辑推荐:
针对高光谱图像(HSI)分类中CNN固定卷积核局限与GCN像素细节丢失的难题,研究人员提出多尺度交互注意力融合网络(MIAF-Net),通过IAECG模块整合CNN局部特征与GCN全局拓扑信息,DBIA模块实现异构特征交互,HAEF模块动态融合多尺度特征。实验表明该方法在四个基准数据集上超越现有技术,为复杂地物分类提供新思路。
高光谱图像(HSI)分类是遥感领域的核心任务,其通过数百个连续光谱波段捕捉地物独特的光谱"指纹",在环境监测、精准农业等领域具有重要应用。然而,传统机器学习方法依赖人工特征设计,难以应对复杂场景的挑战。近年来,卷积神经网络(CNN)虽能自动提取空间-光谱特征,但固定感受野限制了对非欧几里得数据的建模能力;图卷积网络(GCN)虽可通过超像素分割构建图结构捕捉全局拓扑关系,却易丢失像素级细节。更关键的是,现有融合方法多采用简单拼接或加权平均,无法实现异构特征的深度交互,且多尺度特征融合缺乏动态适应性。
河南师范大学的研究团队在《Expert Systems with Applications》发表研究,提出多尺度交互注意力融合网络(MIAF-Net)。该模型创新性地构建了包含交互注意力增强CNN-GCN模块(IAECG)、双分支交互注意力模块(DBIA)和层次注意力增强融合模块(HAEF)的架构。通过四组基准数据集验证,MIAF-Net在印度松树(IP)等场景中平均分类精度达98.7%,较现有最优方法提升2.3%。
关键技术包括:(1)采用多尺度CNN分支(3×3至7×7卷积核)与多粒度GCN分支(超像素尺度50-200)并行提取特征;(2)DBIA模块通过交叉注意力机制实现CNN局部特征与GCN全局拓扑的交互增强;(3)HAEF模块通过通道-空间双注意力动态融合多尺度特征;(4)端到端训练策略整合全部模块,避免传统分块处理导致的空间上下文丢失。
3.1. Overall Framework
研究构建的四模块框架中,浅层特征嵌入(SFE)模块首先对全图像进行光谱降维和空间平滑。IAECG模块通过并行CNN-GCN分支提取特征,其中CNN分支采用多尺度膨胀卷积,GCN分支基于简单线性迭代聚类(SLIC)生成多粒度超像素图。
4.1. Data Description
在IP、帕维亚大学(UP)、休斯顿大学(HU)和Salinas(SA)数据集上的实验显示,仅用每类5个标记样本训练时,MIAF-Net在IP数据集总体精度(OA)达97.52%,较对比方法MiniGCN提升8.63%。特别是对光谱相似的"玉米-大豆"类别,分类精度提高12.7%。
4.2. Parameter Analysis
超参数研究表明:当DBIA模块的注意力头数设为8、HAEF模块的层次数为3时达到最优性能。消融实验证实,移除DBIA会使跨分支特征交互效率下降19.4%,而禁用HAEF导致多尺度融合性能降低14.2%。
4.3. Visualization Analysis
特征可视化显示,DBIA模块使CNN分支在建筑物边缘检测中关注到更多上下文信息,同时GCN分支通过CNN引导增强了超像素内部的一致性。HAEF模块则显著提升了道路等线性地物的连续性表达。
该研究创新性地解决了HSI分类中异构网络融合与多尺度自适应两大挑战。通过双分支交互注意力机制,首次实现CNN与GCN的相互引导式特征学习;层次注意力融合策略突破传统固定权重局限,为复杂场景分类提供新范式。值得注意的是,全图像处理框架避免传统分块方法的信息损失,这对保持农田边界、道路网络等长程空间关系至关重要。未来工作可探索该框架在时序HSI分析和高分辨率遥感场景的扩展应用。
生物通微信公众号
知名企业招聘