基于解耦凸规划与展开策略的反向排序平方和稀疏正则化方法及其在图像复原中的应用
《IEEE Open Journal of Signal Processing》:Sparse Regularization With Reverse Sorted Sum of Squares via an Unrolled Difference-of-Convex Approach
【字体:
大
中
小
】
时间:2025年12月01日
来源:IEEE Open Journal of Signal Processing 2.7
编辑推荐:
本文推荐一种新颖的稀疏正则化方法——反向排序平方和(RSSS),用于解决欠定逆问题中传统L1范数等存在的幅度低估和微小扰动消失问题。研究人员通过将非凸优化问题转化为差分凸规划,并结合展开学习技术,构建了理论保证收敛且计算高效的算法。实验表明,该方法在图像去模糊和超分辨率任务中均优于现有方法,为信号处理领域的稀疏重建提供了新思路。
在信号处理、计算成像和机器学习等诸多领域,我们常常需要从观测数据中复原原始信号,这类问题被称为逆问题。由于观测数据往往不足或存在噪声,逆问题通常是不适定的,这就需要引入正则化技术来获得有意义的解。其中,稀疏正则化因其能够促进解的稀疏性而成为最常用的方法之一。然而,传统的稀疏正则化函数,如广为人知的L1范数,虽然能有效诱导稀疏性,却存在两个固有缺陷:一是幅度低估,即复原信号的幅值往往小于真实值;二是扰动消失,即信号中的微小细节在复原过程中被完全抹去。这些问题在图像复原中会导致边缘模糊或出现伪轮廓等不良效果。
为了克服这些局限,研究者们尝试了多种非凸正则化函数,例如L0伪范数、Lp拟范数(0<>1范数(ROWL),它通过将信号幅值降序排列并与单调非减权重向量做内积,同时缓解了幅度低估和扰动消失问题,但其求解算法(如交替方向乘子法,ADMM)通常基于启发式构造,计算复杂且参数调优困难。
为了解决上述所有问题,日本NTT公司与东京科学大学的研究人员合作,在《IEEE Open Journal of Signal Processing》上提出了一种名为反向排序平方和(RSSS)的新型稀疏正则化函数,并开发了一种基于差分凸(DC)规划和深度展开的高效求解算法。
研究人员开展这项研究的核心创新在于RSSS函数的定义及其巧妙的转化。RSSS定义为信号幅值降序排列后的加权平方和:Ψw(x) = (1/2) Σn=1N wn |x|[n]2,其中w是单调非减的非负权重向量。通过数学变换,RSSS可以精确地表示为两个凸函数之差:Ψw(x) = (wN/2) ||x||2 - Ψω(x),其中ω是构造出的单调非增权重。这种差分凸形式使得原本的非凸优化问题能够利用成熟的DC规划理论进行求解。
为了开展研究,作者主要运用了几个关键技术方法:首先是差分凸编程框架,他们采用了广义双近端梯度DC算法(GDPGDC)来构建具有理论收敛保证的迭代公式;其次是深度展开技术,将迭代算法展开为有限步的计算图,并通过训练数据(使用DIV2K数据集,包含250张高分辨率图像,随机分为训练、验证和测试集)自动学习算法中的超参数和正则化函数权重,从而大幅减少迭代次数(约10次);再者是矩阵无关方法,算法避免直接求解线性方程组,降低了计算复杂度;最后是群组稀疏正则化,将RSSS与差分线性映射结合,应用于图像复原任务,以同时处理空间梯度和色彩通道间的相关性。
研究将群组RSSS正则化应用于图像线性逆问题,其目标函数包含数据保真项和群组RSSS正则项。通过DC规划转化,得到了具体的迭代更新公式,该公式包含对图像像素值的投影(确保值域在[0,1]内)和对偶变量的更新。这使得该方法能够处理如去模糊和超分辨率等复杂图像复原任务。
在运动去模糊任务中,使用5x5的均匀模糊核。实验结果如下表所示,群组RSSS取得了最高的平均峰值信噪比(PSNR),达到45.69 dB,显著优于其他对比方法(向量全变分VTV, 41.05 dB;总p变分TpV, 41.05 dB;群组ROWL, 37.39 dB)。
图1展示了不同正则化函数的二维等高线图,RSSS的非凸性和沿坐标轴的尖锐形状有助于促进稀疏性。图2的直方图显示,群组RSSS在大多数测试图像上相比VTV取得了最大的PSNR提升。
在运行时间方面,虽然VTV最快(53.74毫秒),但群组RSSS(70.81毫秒)与其他方法(TpV: 62.29毫秒,群组ROWL: 60.65毫秒)处于同一量级,表明其计算复杂度是可接受的。图3的视觉对比进一步证实,群组RSSS复原的图像更清晰,细节更丰富,最接近原始图像。
在超分辨率任务中,使用11x11高斯模糊核和下采样因子4。由于降解矩阵无法通过傅里叶变换对角化,基于ADMM的TpV和群组ROWL方法因需要求解线性方程而计算复杂度过高,无法完成实验。而群组RSSS和VTV则能有效求解。结果表明,群组RSSS以26.27 dB的平均PSNR优于VTV的26.01 dB。
图4显示群组RSSS在几乎所有测试图像上都优于VTV。运行时间上,群组RSSS(73.59毫秒)略高于VTV(56.42毫秒),但仍在合理范围内。图5的视觉结果清晰表明,群组RSSS复原的图像细节保持更好,避免了VTV产生的过度平滑现象。
本研究提出并验证了反向排序平方和这一新颖的稀疏正则化函数。理论分析表明,RSSS能够有效缓解幅度低估和扰动消失问题。通过将其优化问题转化为差分凸规划,研究者构建了具有理论收敛保证的迭代算法。进一步结合深度展开技术,实现了超参数的自动确定和迭代次数的显著减少(约10次)。在图像去模糊和超分辨率任务上的实验证明,该方法在复原精度上显著优于向量全变分(VTV)、总p变分(TpV)和群组反向排序加权L1范数(ROWL)等现有方法,同时保持了合理的计算复杂度。特别重要的是,在超分辨率这类更复杂、对算法矩阵无关性要求更高的任务中,群组RSSS是少数能够有效求解且性能优异的方法之一。
这项工作的意义在于,它为解决稀疏正则化中长期存在的难题提供了一个统一且高效的框架。其理论严谨性、计算可行性和卓越的性能表现,预示着RSSS在信号处理、图像复原乃至更广泛的逆问题求解领域具有广阔的应用前景。该方法为开发新一代稀疏重建算法奠定了坚实的基础。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号