编辑推荐:
针对侧扫声呐图像因数据少致模型过拟合、有效特征少致效率低的问题,研究人员提出融合贝叶斯结构与区域特征选择的深度学习框架,用滚动区域选择提取关键特征,以 VB-CNN 执行 SR 任务,实验证明该方法有效。
在海洋探索的广阔领域中,侧扫声呐(Side-scan Sonar)凭借其广阔的搜索范围和强大的识别能力,成为海底地貌分割、目标检测等研究的重要工具。然而,声学图像的固有特性导致其分辨率较低、背景复杂且目标特征模糊,严重影响后续任务的准确性。传统基于插值或图像先验的超分辨率(Super-Resolution, SR)技术在处理这类图像时效率低下,而深度学习虽在光学图像 SR 中表现优异,但应用于侧扫声呐图像时面临两大难题:一是数据稀缺导致模型过拟合,二是有效特征不足致使重建效率降低。如何在小样本、高噪声的声学图像中实现精准的超分辨率重建,成为制约海洋探测技术发展的关键瓶颈。
为突破这一困境,国内研究团队开展了针对侧扫声呐图像超分辨率的专项研究。研究成果发表在《Engineering Applications of Artificial Intelligence》,为海洋声学图像处理提供了新的解决思路。
研究人员提出了一种融合变分贝叶斯(Variational Bayes, VB)框架与区域特征选择的深度学习模型。该研究的核心技术方法包括两部分:首先,采用滚动区域选择方法(Rolling Region Selection Method)从侧扫声呐图像中提取关键感兴趣区域(Region of Interest, ROI),通过聚焦目标特征密集区域,在减少计算量的同时保留核心信息;其次,以变分贝叶斯卷积神经网络(VB-CNN)替代传统卷积神经网络(CNN),利用变分推理和参数化技术估计模型不确定性,增强小数据集下的泛化能力,缓解过拟合问题。实验采用真实海洋环境采集的 SSS-VOC 数据集及其他公开数据集,在缩放因子 r=2 和 r=4 条件下进行定性与定量分析。
关键技术方法
研究主要采用两项关键技术:一是区域特征选择,通过检测算法定位图像中特征丰富的目标区域,仅对该区域进行高分辨率重建,非关键区域采用轻量级模型处理,提升整体效率;二是变分贝叶斯卷积神经网络(VB-CNN),通过引入贝叶斯结构,将网络参数视为随机变量,利用变分推断近似后验分布,实现对模型不确定性的量化,增强小样本场景下的鲁棒性。
研究结果
区域选择方法的有效性
通过滚动区域选择,模型能够有效区分侧扫声呐图像中的复杂背景与目标区域。实验表明,该方法在保持重建图像质量的前提下,减少了约 30% 的计算量,显著提升了超分辨率任务的效率。相较于传统全局处理方法,聚焦 ROI 的策略更适用于侧扫声呐图像中 “背景冗余、目标稀疏” 的特性。
VB-CNN 的泛化能力提升
在小数据集场景下,VB-CNN 的峰值信噪比(Peak Signal Noise Ratio, PSNR)和结构相似性指数(Structural Similarity Index, SSIM)均优于传统 CNN 模型。例如,在 r=4 的缩放因子下,VB-CNN 在 SSS-VOC 数据集上的 PSNR 值提高了 2.3dB,SSIM 值提升 0.05,证明其通过贝叶斯结构有效缓解了过拟合问题,增强了对低分辨率声学图像的特征提取能力。
融合框架的综合性能
将区域选择与 VB-CNN 结合后,模型在定性视觉效果和定量指标上均表现出色。重建后的图像不仅能够清晰还原目标的纹理细节(如海底岩石结构、人工目标轮廓),而且在跨数据集测试中展现出较强的泛化能力,尤其在复杂海况下的图像重建效果显著优于现有方法(如 SRCNN、EDSR)。
研究结论与意义
本研究针对侧扫声呐图像的独特挑战,提出了 “区域选择 + 贝叶斯深度学习” 的超分辨率框架,为小样本、高噪声场景下的图像重建提供了新范式。通过区域选择策略,解决了传统方法对冗余背景的无效计算问题,提升了处理效率;借助 VB-CNN 的贝叶斯结构,增强了模型在小数据集下的泛化能力,为海洋探测中数据稀缺问题提供了有效解决方案。该研究成果不仅可直接应用于海底目标检测、地貌分析等领域,还为医学超声图像、遥感影像等类似小样本图像的超分辨率处理提供了理论参考和技术借鉴,推动了跨学科图像处理技术的发展。