编辑推荐:
水下图像存在细节丢失、色彩失真和模糊等问题,影响后续任务。研究人员提出 UWEGAN 算法,结合 U 形编码器与生成对抗网络(GAN)。实验表明,该算法显著提升视觉质量,在 PSNR、SSIM 和 MSE 指标上有明显改善,对水下图像增强意义重大。
水下世界神秘而深邃,海洋科学研究、水下考古、资源勘探以及海洋工程等诸多领域都依赖水下图像获取关键信息。然而,水下成像环境极为复杂,就像给相机镜头蒙上了一层 “神秘面纱”。光线在水中传播时,会被大量吸收和散射,导致图像亮度不足、对比度降低;色彩也会出现严重失真,红色常常率先 “隐身”,水下图像往往呈现单调的蓝绿色调;此外,光的折射和像差还会使图像发生变形。
在这样的困境下,传统的水下图像增强方法显得力不从心。直方图均衡化虽能调整对比度和亮度,但容易造成图像过饱和、细节丢失;基于深度学习的方法,如 UIE-Net、UWCNN 等,也存在各种问题,有的因依赖合成数据集导致过亮,有的特征提取能力有限,图像模糊、纹理缺失。因此,开发一种更有效的水下图像增强算法迫在眉睫。
为解决这些难题,研究人员开展了关于水下图像增强算法的研究。他们提出了一种名为 UWEGAN(Underwater Image Enhancement Generative Adversarial Network)的新型水下图像增强算法,该算法结合了 U 形编码器与生成对抗网络(GAN)。这一研究成果发表在《Digital Signal Processing》上,为水下图像增强领域带来了新的希望。
研究人员在开展研究时,主要运用了以下关键技术方法:首先,设计了多尺度特征融合模块(MFFM),通过不同尺度的卷积核提取图像特征,增强图像的局部信息;其次,构建了特征交互注意力模块(FIA),由通道注意力和像素注意力组成,用于校正色彩失真;最后,使用复合残差提取单元(CREU)替代传统卷积块,解决图像模糊问题。
下面来看具体的研究结果:
- 多尺度特征融合模块(MFFM)的作用:MFFM 利用不同尺度的卷积核,能够捕捉图像中不同大小和形状的物体或纹理,提取比单一卷积核更丰富的特征。它增强了图像的局部信息,提供更多细节和上下文特征信息,适应不同图像场景,有效避免了细节纹理的丢失。
- 特征交互注意力模块(FIA)的效果:FIA 模块通过通道注意力学习每个通道的权重,强化图像中的重要特征通道,提高图像对比度;像素注意力则对图像中每个位置的注意力进行精细调整,减少伪影干扰,校正色彩失真,改善图像的整体色彩平衡。
- 复合残差提取单元(CREU)的优势:CREU 引入跨层连接和残差学习机制,有效避免了普通卷积层处理大规模特征时可能产生的信息损失。其具有更大的感受野和更深的网络深度,能更好地捕捉局部特征并传递给下一层,实现图像去模糊,保留图像细节。
在研究结论和讨论部分,UWEGAN 算法展现出显著的优势。它成功解决了水下图像细节丢失、色彩失真和模糊等关键问题,通过 MFFM、FIA 和 CREU 模块的协同作用,提升了图像的视觉质量。在公共水下数据集上的实验表明,UWEGAN 在峰值信噪比(PSNR)、结构相似性指数(SSIM)和均方误差(MSE)等指标上分别取得了 2.33%、2.12% 和 1.67% 的平均提升。这一成果不仅为水下图像增强领域提供了新的技术方案,也为海洋科学研究、资源勘探等相关领域提供了更清晰、准确的图像数据支持,有助于推动这些领域的进一步发展。同时,该算法在复杂水下环境下的良好表现,也为后续相关研究奠定了坚实基础,具有重要的理论意义和实际应用价值。