基于光谱-空间自注意力Transformer网络的高光谱图像分类方法研究

【字体: 时间:2025年06月16日 来源:Optics and Lasers in Engineering 3.5

编辑推荐:

  针对高光谱图像(HSI)分类中存在的谱间冗余、空间相关性建模不足等问题,研究人员提出光谱-空间自注意力Transformer网络(SSSAT-Net)。该模型通过PCA降维、CBAM特征筛选、SpeAM谱带校准、MDSA空间相似性计算及Transformer全局建模,在五个公开数据集上实现最优分类性能,为遥感地物识别提供新范式。

  

高光谱图像分类技术是遥感领域的核心课题,其通过整合紫外至红外波段的光谱-空间双重信息,在城市化监测、精准农业等领域发挥关键作用。然而,传统方法面临三大挑战:数百个光谱波段存在严重冗余,不同波段对分类贡献度差异显著;基于图像块(patch)的输入策略难以有效建模中心像素与邻域的空间相关性;卷积神经网络(CNN)的局部感受野限制全局特征捕获能力。这些瓶颈导致现有模型分类精度受限,亟需开发新型网络架构。

安徽高校联合研究团队在《Optics and Lasers in Engineering》发表论文,提出光谱-空间自注意力Transformer网络(SSSAT-Net)。该研究创新性地将深度可分离卷积与注意力机制结合,通过四阶段架构实现突破:首先采用主成分分析(PCA)压缩数据维度,继而通过卷积块注意力模块(CBAM)完成特征初筛;设计的谱注意力模块(SpeAM)嵌入压缩激励(SE)机制,实现谱带动态加权;空间注意力模块(SpaAM)引入曼哈顿距离自相似性计算(MDSA)和多尺度卷积融合(MSCIF)策略;最终采用Transformer捕获长程依赖。在Indian Pines等五个数据集上的实验表明,该模型平均分类精度达98.7%,较基线方法提升5.2%。

关键技术包括:1) PCA降维处理原始HSI数据;2) CBAM模块进行通道-空间双注意力筛选;3) SpeAM结合深度可分离卷积与SE机制;4) SpaAM采用MDSA计算特征向量曼哈顿距离相似性;5) MSCIF模块并行使用3×3、5×5、7×7卷积核;6) Transformer编码器提取全局特征。实验使用AVIRIS和ROSIS传感器采集的五个标准数据集验证性能。

网络架构设计
研究团队构建的SSSAT-Net包含四个创新模块:1) CBAM预处理模块通过通道注意力重构谱带权重,空间注意力聚焦关键区域;2) SpeAM采用深度可分离卷积降低参数量,SE机制计算各波段重要性得分;3) SpaAM中MDSA模块创新性使用曼哈顿距离替代传统余弦相似度,计算中心像素与8邻域特征向量的L1范数距离;4) MSCIF通过多尺度空洞卷积捕获不同粒度空间特征。

实验结果分析
在Indian Pines数据集上,SSSAT-Net总体精度(OA)达99.12%,较次优方法SSTN提升2.3%。消融实验显示:单独移除SpeAM导致玉米-大豆混淆误差上升15.7%,证明谱带校准的重要性;MDSA模块使空间细节分类准确率提升8.9%。可视化分析表明,该模型在农田边界处的错分率较3D-CNN降低62%。

结论与展望
该研究通过光谱-空间双注意力机制与Transformer的有机结合,有效解决了HSI分类中的三大核心挑战。SpeAM模块参数量仅为传统3D卷积的1/8,MDSA的线性计算复杂度显著优于二次复杂度的点积注意力。未来工作可探索轻量化部署方案,并将该框架拓展至多模态遥感数据融合领域。研究成果为高精度地物分类提供了新的方法论指导。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号