DEMUNet:基于双编码器Mamba U-Net的高光谱图像分类创新方法
《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》:DEMUNet: Dual Encoder Mamba U-Net for Hyperspectral Image Classification
【字体:
大
中
小
】
时间:2025年12月08日
来源:IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing 5.4
编辑推荐:
本文针对高光谱图像分类中Transformer模型二次计算复杂度高、Mamba模型单向扫描限制特征表达的问题,提出了双编码器Mamba U-Net(DEMUNet)。该模型通过交叉扫描Mamba模块实现多方向上下文感知,结合CNN与Transformer的双路径编码器融合局部细节与全局特征,在Indian Pines等数据集上达到98.56%的最高分类精度,为遥感图像处理提供了线性复杂度的长程依赖建模新范式。
在遥感技术飞速发展的今天,高光谱成像(HSI)技术通过捕获数百个连续光谱波段的数据,为农业监测、环境保护和资源勘探等领域提供了前所未有的物质识别能力。然而,这种海量的光谱信息也带来了巨大挑战——如何从高维数据中精准提取有效特征并实现高效分类,一直是遥感图像处理领域的核心难题。
传统上,Transformer模型凭借其强大的全局建模能力成为高光谱图像分类的主流方法,但其自注意力机制存在的二次计算复杂度问题,导致内存消耗和计算效率成为瓶颈。近年来提出的Mamba模型虽然以线性复杂度实现了与Transformer相媲美的性能,但其单向扫描策略难以有效捕捉中心像素与周边环境的关联关系,限制了特征表达能力。这一矛盾促使研究人员寻求新的技术突破。
针对这一挑战,湖北工业大学的崔现代和张丽团队在《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》上发表了题为"DEMUNet: Dual Encoder Mamba U-Net for Hyperspectral Image Classification"的研究论文,提出了一种创新性的双编码器Mamba U-Net架构。该工作通过巧妙融合Mamba的线性复杂度优势与U-Net的多尺度特征融合能力,实现了在高光谱图像分类任务上的突破性进展。
研究人员开发的核心技术方法包括:交叉扫描Mamba模块(通过水平与垂直双向扫描增强空间上下文感知)、双路径编码器(结合CNN的局部特征提取与Transformer的全局建模)、以及U-Net编解码结构(通过跳跃连接保持空间细节)。实验采用Indian Pines、Pavia University、Houston 2013和ZY-1 02D四个典型高光谱数据集进行验证。
DEMUNet采用多阶段处理流程:首先提取以目标像素为中心的13×13空间窗口作为输入;然后通过交叉扫描Mamba模块进行双向特征提取,其中水平扫描直接处理输入,垂直扫描先转置后处理再转置回原方向,最后通过可学习参数λ进行自适应融合;接着使用双路径编码器并行处理特征,卷积分支通过三层卷积层提取局部特征,Transformer分支通过自注意力机制捕获全局上下文,两者通过元素级相加融合;融合后的特征送入U-Net编解码结构,编码器通过下采样捕获高层语义特征,解码器通过上采样恢复空间细节,跳跃连接确保细节不丢失;最后通过全局平均池化和线性层输出分类结果。
在Indian Pines数据集上,DEMUNet取得了98.56%的总体分类精度(OA),显著优于对比方法。特别是在"C4(Grass pasture)"和"C8(Soybean-mintill)"类别上达到100%的准确率,表明模型对植被和农作物类别具有极强的区分能力。可视化结果显示,DEMUNet生成的分类图与真实标记高度一致,区域均匀且边界清晰。
在University of Pavia数据集上,DEMUNet的OA达到99.60%,在"C2(Meadows)"和"C5(Metal Sheets)"等类别上接近完美分类。值得注意的是,模型对"江1(Asphalt)"和"江8(Bricks)"等城市地物也表现出色,证明了其在不同场景下的强泛化能力。
Houston 2013数据集的实验结果进一步验证了DEMUNet的优越性,OA达到99.61%。该数据集包含15个城市地物类别,如"Healthy grass"、"Residential"和"Highway"等,DEMUNet在多数类别上取得100%准确率,仅在少数复杂场景下出现轻微误分。
在国产卫星ZY-1 02D数据集上,DEMUNet同样表现优异(OA=97.29%),证明了其对国产遥感数据的适应能力。特别是在"Tree"和"Water"类别上分别达到98.64%和99.53%的准确率,展现了在生态监测和水体识别方面的应用潜力。
消融实验证实了各模块的必要性:移除交叉扫描Mamba模块导致OA下降至97.99%;去掉U-Net结构后OA降至97.20%;仅使用Mamba和U-Net而不用双路径编码器时OA为97.65%。这些结果证明各组件具有协同增强效应。
计算效率方面,DEMUNet在Indian Pines数据集上的推理时间为67.78毫秒/批次,计算复杂度为1.15 GFLOPs,参数数量为29.02M。虽然略高于轻量级模型MiniGCN,但远低于其他先进模型,且在准确率上具有明显优势,实现了精度与效率的良好平衡。
本研究提出的DEMUNet框架通过创新性地整合交叉扫描Mamba、双路径编码器和U-Net架构,有效解决了高光谱图像分类中的关键挑战。交叉扫描策略克服了传统Mamba的单向限制,双路径设计实现了局部与全局特征的互补,U-Net结构保障了多尺度信息的有效利用。
实验结果表明,DEMUNet在多个标准数据集上均达到了最先进的分类性能,同时保持了合理的计算复杂度。这一成果不仅为高光谱图像分析提供了新的技术路径,也为其他遥感图像处理任务提供了有益借鉴。未来工作可进一步探索Mamba模型在更多遥感场景下的应用,以及模型在边缘设备上的部署优化,推动遥感智能解译技术的实际应用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号