可解释的深度网络:利用光谱变异性相似性实现高精度的高光谱解混

《Knowledge-Based Systems》:Interpretable Deep Network Harnessing Spectral Variability Similarity for Accurate Hyperspectral Unmixing

【字体: 时间:2025年10月30日 来源:Knowledge-Based Systems 7.6

编辑推荐:

  提出IDNSVS方法,通过深度unfolding架构和对抗学习,有效建模并处理高光谱图像中的光谱可变性,同时保持物理可解释性,实验表明其性能优于现有方法。

  在当今的遥感技术领域,高光谱图像(HSI)因其丰富的光谱信息而受到广泛关注。相比于传统的多光谱图像,高光谱图像包含更多的光谱波段,能够提供更细致、更全面的地物信息。这种高光谱数据的高分辨率特性使其在地质勘探、精准农业、环境监测以及食品安全等多个领域展现出巨大的应用潜力。然而,由于成像系统空间分辨率的限制和自然场景中材料分布的异质性,单个像素中往往包含多种材料,形成了所谓的混合像素。混合像素的存在显著影响了高光谱遥感数据的处理与应用,因此,如何有效进行高光谱图像的光谱解混成为研究的热点。

光谱解混的核心目标是将混合像素的光谱响应分解为若干个纯净的光谱成分,即所谓的端元(endmembers),以及它们在该像素中的比例,即丰度(abundances)。在这一过程中,线性混合模型(LMM)作为一种基础框架被广泛应用。LMM假设每个混合像素的光谱响应可以表示为端元的线性组合,前提是传感器检测到的反射光仅来源于地面的一次相互作用。在实际应用中,LMM通常涉及两个主要步骤:端元提取和丰度估计。端元提取旨在从高光谱数据中识别出纯净的光谱成分,而丰度估计则用于计算每个端元在混合像素中的占比。为了提升解混效果,许多研究引入了约束条件,例如丰度非负约束(ANC)和丰度总和为一约束(ASC),以确保解混结果的物理合理性。

尽管传统方法在一定程度上能够满足高光谱解混的需求,但在处理复杂、动态变化的光谱混合过程时仍存在局限。近年来,随着深度学习技术的快速发展,神经网络方法在高光谱解混领域展现出强大的潜力。深度学习能够从高光谱数据中学习到复杂的非线性关系,从而提升解混的准确性。然而,神经网络方法通常被视为“黑箱”模型,缺乏传统方法所具有的物理可解释性。因此,研究者们开始探索融合传统模型与深度学习的混合方法,以兼顾模型的可解释性和解混效果。

深度展开(deep unfolding)技术成为连接传统算法与深度学习的重要桥梁。该技术的核心思想是将传统算法的迭代过程映射为神经网络的层结构,从而在保留算法物理意义的同时,提升其计算效率和性能。例如,基于迭代收缩阈值算法(ISTA)的模型启发式神经网络(MNN)通过深度展开技术构建了适用于监督和非监督场景的解混网络。同样,基于交替方向乘子法(ADMM)的展开网络(U-ADMM-Net)在解混过程中引入了ADMM算法的迭代步骤,进一步提升了收敛速度和解混精度。此外,一些研究将卷积神经网络(CNN)与深度展开技术结合,以捕捉相邻像素之间的空间相关性。例如,深度可解释全卷积神经网络(DIFCNN)通过CNN初始化图像,并将空间信息作为先验知识引入展开网络,从而增强解混的鲁棒性。

然而,尽管上述方法在高光谱解混中取得了一定的进展,它们仍然在一定程度上忽略了光谱变异性(Spectral Variability, SV)这一关键因素。在实际场景中,由于外部因素如大气条件、光照变化和观测时间,以及内部因素如材料的固有结构特性,同一材料在不同像素中的光谱响应可能会有所差异。这种现象被称为光谱变异性,它对解混精度具有重要影响。因此,许多研究致力于开发能够显式建模光谱变异性的方法。例如,Drumetz等人提出的扩展线性混合模型(ELMM)引入了缩放因子,以表征不同像素中的光谱变异性。在ELMM的基础上,一些研究进一步引入了注意力机制和Transformer架构,以增强光谱与空间特征的融合能力,并更好地捕捉长距离依赖关系。

尽管这些方法在建模光谱变异性方面取得了一定的成果,但它们仍然存在一定的局限性。例如,ELMM模型虽然能够表征光谱变异性,但其缩放因子的设定可能无法完全覆盖所有类型的变异性。而基于生成模型的方法,如概率生成模型(PGMSU)和对抗生成网络(AAENet),则通过学习数据的概率分布来生成具有变异性特征的端元。然而,这些方法生成的端元通常缺乏明确的物理意义,难以解释其在实际场景中的作用。因此,如何在保持端元物理可解释性的同时,有效建模光谱变异性,成为高光谱解混研究中的一个重要挑战。

为了解决这一问题,本文提出了一种新的可解释性深度网络方法,即基于光谱变异性相似性的可解释性深度网络(Interpretable Deep Network Harnessing Spectral Variability Similarity, IDNSVS)。该方法的核心思想是,利用深度展开技术构建网络结构,同时考虑光谱变异性在局部同质区域中的相似性。具体而言,IDNSVS通过深度展开的方式,将修改后的ELMM模型转化为网络层,从而在不依赖精确建模光谱变异性的情况下,实现对光谱变异性的捕捉。在该网络中,每个超像素区域的丰度和缩放因子被估计,这些缩放因子用于表征该区域的主要光谱变异性。同时,为了建模无法通过缩放因子完全捕捉的残余变异性,引入了服从特定分布的随机变量。

此外,IDNSVS还引入了批评者(critic)模块,用于指导端元的生成。批评者通过对抗学习的方式,对网络生成的端元进行评估,确保其符合实际场景中的物理特性。这一过程不仅提升了端元的可解释性,还增强了解混结果的鲁棒性。为了进一步提升模型的稳定性,IDNSVS假设同一区域内的像素具有相似的光谱变异性,即它们共享相同的缩放因子和分布。这种假设有助于减少可训练参数的数量,同时保持模型对光谱变异性的有效建模。

本文的主要贡献包括三个方面。首先,通过深度展开技术,将修改后的ELMM模型转化为网络结构,从而在不依赖精确建模光谱变异性的情况下,实现对光谱变异性的有效捕捉。其次,考虑到局部区域中相邻像素的空间-光谱相关性,以及诱导光谱变异性的多种因素,假设同一区域内的像素具有相似的光谱变异性,从而提升模型的鲁棒性和可解释性。最后,通过对抗学习的方式,训练网络以生成具有物理意义的端元,从而在保持端元可解释性的同时,提升解混的精度和稳定性。

在实验部分,本文对IDNSVS方法进行了全面评估。通过在合成数据集和两个真实世界数据集上的实验,验证了IDNSVS在高光谱解混任务中的有效性。实验结果表明,IDNSVS不仅在解混精度上达到了与当前最先进的方法相当的水平,还在物理可解释性方面表现出显著优势。此外,通过消融实验,进一步分析了IDNSVS中各个组件对解混性能的影响,从而验证了该方法设计的合理性。

总的来说,本文提出的IDNSVS方法在高光谱解混领域具有重要的应用价值。它不仅能够有效建模光谱变异性,还通过深度展开技术和对抗学习机制,提升了模型的可解释性和鲁棒性。这一方法为高光谱图像的解混提供了一种新的思路,有望在未来的遥感应用中发挥更大的作用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号