通过DCT频谱恢复技术提升离散余弦单像素成像质量
《Optical Materials: X》:Enhancing discrete cosine single-pixel imaging via DCT spectrum restoration
【字体:
大
中
小
】
时间:2025年08月06日
来源:Optical Materials: X CS4.2
编辑推荐:
提出一种基于深度学习的DCSPI方法,通过DCT残差块和频率恢复损失函数估计缺失DCT系数,有效提升低采样率(<6.25%)下的成像质量,实验验证其有效性。
单像素成像技术(Single-Pixel Imaging, SPI)是一种替代传统成像方式的计算成像方法,它不依赖于像素化传感器如电荷耦合器件(CCD)和互补金属氧化物半导体(CMOS)来捕获图像。SPI的核心思想是通过使用空间光调制器(Spatial Light Modulator, SLM)对目标场景进行一系列空间分布模式的调制,同时利用单像素探测器测量这些模式的总光强度,从而实现图像的重建。这种方法在图像获取过程中不需要高分辨率的传感器,因此在某些特殊应用场景中具有独特的优势,例如在资源受限的设备上进行实时成像。
在SPI的众多实现方案中,离散余弦单像素成像(Discrete Cosine Single-Pixel Imaging, DCSPI)因其在计算复杂度和能量压缩特性方面的优越表现而受到广泛关注。DCSPI采用离散余弦变换(Discrete Cosine Transform, DCT)作为其核心处理手段,这种方法仅涉及实数计算,相较于涉及复数运算的傅里叶单像素成像(Fourier Single-Pixel Imaging, FSPI),具有更低的计算成本和更高的数据压缩效率。然而,DCSPI在低采样率(低于6.25%)的情况下,仍然面临图像质量下降的问题,如模糊和环形伪影(ringing effect)等。这是因为DCT在低采样率下无法完整地捕捉图像的高频信息,导致图像重建过程中丢失关键细节。
为了在低采样率下提升DCSPI的成像质量,本文提出了一种基于深度学习的图像重建方法。该方法将频率信息特征引入到深度卷积网络架构中,并在DCT域设计了一种频率损失函数,以增强网络对频率信息的感知能力。通过这种方式,网络能够在训练过程中更有效地学习如何估计缺失的DCT系数,从而在低采样率下实现更高质量的图像重建。具体来说,该方法首先通过特定的采样掩码对完整的DCT频谱进行下采样,然后将这些下采样的数据作为网络的输入,通过深度学习模型预测出缺失的DCT系数,并利用这些系数进行图像重建。
为了验证所提出方法的有效性,本文构建了一个基于DIV2K数据集的自定义数据集。DIV2K是一个广泛使用的高分辨率图像数据集,包含大量自然场景的RGB图像。通过将这些图像转换为灰度图像,并将其分割为256×256像素的子图像,本文获得了高质量的原始图像数据。随后,对这些灰度图像进行完整的DCT频谱计算,并使用特定的采样掩码对其进行下采样。最后,将这些下采样的数据输入到所设计的深度学习模型中,进行图像重建并评估其质量。实验结果表明,所提出的方法在采样率低于6.25%的情况下,能够显著提升图像质量,特别是在减少模糊和伪影方面表现出色。
在模型设计方面,本文采用了一种带有残差学习结构的深度卷积网络。该网络的一个关键创新点在于引入了DCT流的残差块(DCT-Resblocks),使得网络能够在DCT域中提取和处理频率信息。传统的深度学习模型通常在空间域中进行特征提取,而本文的方法则通过在DCT域中设计网络结构,使得模型能够更直接地学习与图像频率特性相关的模式。这种设计不仅提高了模型对频率信息的感知能力,还增强了其在低采样率下的鲁棒性。
此外,本文还设计了一种基于DCT的频率恢复损失函数。该损失函数的核心思想是通过在训练过程中强调频率域中的信息,使得网络能够更准确地估计缺失的DCT系数。传统的损失函数通常关注空间域中的图像质量,而本文的方法则通过引入频率域的损失项,使网络在训练过程中同时优化空间域和频率域的重建效果。这种方法能够有效提升图像在低采样率下的清晰度和细节表现,减少由于高频信息缺失导致的图像失真。
在训练过程中,本文采用了端到端的训练策略,即网络的输入是下采样的DCT频谱,输出是重建后的图像。通过这种方式,网络能够直接学习如何从下采样的数据中恢复完整的图像信息。为了进一步提高模型的泛化能力,本文还使用了大量不同场景和光照条件下的图像数据进行训练,确保模型能够适应多种实际应用场景。
实验结果表明,所提出的方法在多个指标上均优于传统方法。例如,在峰值信噪比(PSNR)和结构相似性指数(SSIM)等图像质量评估指标上,该方法能够显著提升重建图像的性能。此外,该方法在不同采样率下的表现也表明其在低采样率下的稳定性。相比于其他基于迭代优化的重建方法,本文的方法不需要复杂的迭代过程,能够在毫秒级时间内完成图像重建,适用于实时成像应用。
综上所述,本文提出了一种基于深度学习的DCSPI图像重建方法,通过引入频率信息特征和设计DCT域的频率恢复损失函数,有效解决了低采样率下图像质量下降的问题。该方法不仅在理论上具有创新性,而且在实验验证中表现出良好的性能,为DCSPI技术在实际应用中的推广提供了新的思路和方法。未来的研究可以进一步探索该方法在不同图像尺寸和复杂场景下的适用性,并尝试将其扩展到其他类型的单像素成像技术中,以实现更广泛的图像重建能力。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号