基于双层学习的空间自适应?p范数相位解缠方法研究
《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》:SPAN-PU: Spatially Adaptive ?p
-Norm Phase Unwrapping via Bilevel Learning
【字体:
大
中
小
】
时间:2025年12月23日
来源:IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing 5.4
编辑推荐:
本文针对干涉合成孔径雷达(InSAR)相位解缠(PU)中传统全局优化方法采用单一固定范数(如?1或?2)无法同时抑制低质量区域误差传播和保留高质量区域细节的问题,提出了一种空间自适应?p范数相位解缠框架(SPAN-PU)。该框架通过双层学习策略,将范数指数建模为空间变化场p(x),使算法能够根据局部噪声、相干性和地形特征自适应调整误差度量。实验结果表明,SPAN-PU在精度和泛化性能上均优于传统固定范数和基于深度学习的PU方法,为深度学习与物理模型结合的可解释性研究提供了新思路。
在遥感测绘领域,干涉合成孔径雷达(Interferometric Synthetic Aperture Radar, InSAR)技术如同一位高精度的“大地测量师”,能够通过雷达波的干涉原理精确反演地表高程和形变信息。然而,InSAR测量得到的相位数据是被包裹在(-π, π]区间内的主值,需要经过相位解缠(Phase Unwrapping, PU)这一关键步骤才能恢复出真实的绝对相位。可以说,相位解缠的准确性直接决定了数字高程模型(Digital Elevation Model, DEM)和地表形变监测结果的可靠性,是InSAR数据处理链条中至关重要的一环。
传统的相位解缠方法主要分为路径跟踪法和全局优化法两大类。其中,全局优化方法通过最小化解缠相位梯度与基于相位连续性假设估计的梯度之间的?p范数残差来恢复绝对相位。不同的p值会诱导出不同的解缠行为:例如,?1范数(p=1)倾向于抑制异常值,有利于保持细节和条纹一致性;而?2范数(p=2)则倾向于均匀分布误差,产生更平滑的结果。然而,现实场景中的噪声统计特性、相干性和地形起伏在空间上是异质性的。低质量区域需要更强的异常值抑制以遏制误差传播,而高质量区域则需要保留精细结构避免过度平滑。传统的全局优化方法采用单一的固定范数(通常是?1或?2)处理整个场景,犹如用同一把尺子去衡量所有地形,显然无法兼顾不同区域的矛盾需求。尽管有研究尝试分区策略,在不同区域使用不同的离散范数(如在弱噪声区用?1,强噪声区用?∞),但这种划分依赖于经验性的相干性分区,且难以保证组合的全局最优性。因此,如何让算法智能地获得空间自适应的范数组合,成为提升相位解缠性能的关键难题。
为了解决这一挑战,由电子科技大学资源与环境学院的辛晔、於汉文、杨涛利、严岩以及常熟理工学院计算机科学与工程学院的周立凡共同发表在国际期刊《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》上的研究论文《SPAN-PU: Spatially Adaptive ?p-Norm Phase Unwrapping via Bilevel Learning》,提出了一种名为SPAN-PU的创新框架。该框架的核心思想是将?p范数中的指数p从一个全局标量提升为一个在图像域Ω上连续变化的空间场p(x) ∈ [pmin, pmax]。在每个位置x,p(x)的值指定了该处梯度残差的局部?p(x)惩罚力度。为了实现这种自适应性,研究人员设计了一个可解释的双层学习(Bilevel Learning)策略:内层是一个求解器(SolveNet),负责在给定p(x)的条件下执行相位解缠,最小化自适应?p(x)范数目标函数;外层是一个参数预测器(PNet),负责从训练数据中学习p(x)的空间分布,其目标是使得最终解缠出的相位与参考相位尽可能匹配。
为开展研究,作者主要运用了以下几项关键技术方法:首先,基于中国地区的航天飞机雷达地形测绘任务(Shuttle Radar Topography Mission, SRTM)数字高程模型数据合成训练和测试集,通过施加随机高程模糊因子和不同信噪比的高斯噪声模拟真实InSAR观测条件。其次,构建了以U-Net为骨干网络的双层学习框架,其中PNet和SolveNet均采用带有残差块的编码器-解码器结构。第三,采用了两阶段训练策略,先对SolveNet进行无监督预训练,再通过交替更新PNet和微调SolveNet的参数进行联合训练,优化目标结合了相邻梯度误差和随机像素对梯度误差。实验评估涵盖了模拟数据集和ALOS-2/PALSAR-2、TanDEM-X等真实星载InSAR数据。
研究将SPAN-PU与经典的最小费用流(MCF)、相位解缠图割算法(PUMA)以及一步式深度学习PU方法进行了对比。在模拟测试集上,SPAN-PU取得了最低的均方根误差(RMSE, 3.72 rad),显著优于其他方法。
在ALOS-2/PALSAR-2真实数据(四川地区,1024×1024像素)实验中,该区域地形起伏剧烈,相位连续性假设大面积失效。MCF和PUMA均出现了明显的误差聚集现象。一步式PU方法虽无误差聚集,但细节模糊。SPAN-PU通过学习到的p场削弱了不可靠观测的权重,有效抑制了误差聚集,同时保持了纹理细节,RMSE为14.74 rad,视觉和定量误差均优于对比方法。
在TanDEM-X数据(陕西渭南地区,512×512像素)上的验证进一步证实了上述结论,SPAN-PU在抑制不可靠观测误差和保留高质量区域细节方面均表现最佳。
通过在不同信噪比(SNR, 2-17 dB)的测试集上评估,研究发现随着SNR增加,SPAN-PU与一步式PU方法的性能差距逐渐拉大。在低SNR时,噪声主导误差,两者性能接近。在中高SNR时,地形突变导致的相位不连续性成为主要挑战。SPAN-PU通过自适应p场削弱不可靠梯度观测的影响,降低了对梯度估计误差的敏感性,表现出更强的泛化能力和稳定性。而一步式PU方法由于学习的是从缠绕相位到绝对相位的一对多映射,在面临训练分布外的相位不连续时,泛化能力下降。
对PNet预测的p场进行分析,揭示了其物理意义。研究发现,当某些梯度边的估计误差较大时,PNet倾向于将这些边上的pe值推向下限(pe=1),相当于在目标函数中降低了这些不可靠观测的权重。将这些pe=1的边标记在残差点图上,它们形成了类似分支切割(Branch Cut)的结构。
这种准分支切割结构源于双层学习的目标:为了在SolveNet中减少不可靠观测的影响,PNet通过降低相应边上的pe值来抑制误差传播,其效果等同于在积分图上“移除”这些边,从而形成了平衡残差点的准分支切割。虽然这种结构可能不是几何上最短的切割,也未必完全平衡所有残差,但在?SolveNet和?PNet的联合约束下,它选择削弱或加强某些边的权重,以最大化最终解缠相位的整体精度。这表明学习到的p场可以解释为一种任务最优的分支切割配置,增强了模型的可解释性。
该研究提出的SPAN-PU框架成功解决了传统?p范数相位解缠方法中固定范数无法适应空间异质性需求的核心问题。通过将范数指数建模为空间自适应场p(x),并利用双层学习策略自动从数据中学习其最优分布,SPAN-PU实现了在低质量区域强化误差抑制、在高质量区域精细保持细节的目标。实验证明,该方法在模拟和真实InSAR数据上均取得了优于固定范数模型和端到端深度学习方法的精度与泛化性能。
这项研究的重要意义在于,它展示了将深度学习与物理驱动模型相结合的有效途径。SPAN-PU的内层问题仍然是一个基于?p(x)范数的优化公式,而非纯粹的黑箱端到端映射,这赋予了模型良好的可解释性。研究结果明确提示,当深度学习模型的设计植根于有原则的优化模型,并避免病态的端到端映射时,可以获得更强的泛化能力。这为未来开发兼具高精度、强泛化性和可解释性的遥感信息处理模型提供了清晰的指导方向。SPAN-PU不仅是对相位解缠技术的重要推进,也为解决其他具有空间变化特性的逆问题提供了可借鉴的框架。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号