基于改进YOLOv5的雷达图像目标检测方法及其在噪声与畸变场景下的性能优化
《Journal of Systems Engineering and Electronics》:Improved YOLOv5-Based Radar Object Detection
【字体:
大
中
小
】
时间:2025年12月01日
来源:Journal of Systems Engineering and Electronics 2.1
编辑推荐:
本文针对雷达图像存在漫射弱噪声和成像畸变的问题,提出了一种基于改进YOLOv5的目标检测方法。研究人员通过引入坐标注意力(CA)机制进行特征预提取以增强噪声抑制能力,采用可变形卷积处理不规则目标形态,并设计改进的随机加权平均(SWA)方法提升模型泛化性能。实验结果表明,该模型在卫星ISAR图像数据集上mAP0.5达到0.8562,较原YOLOv5提升3.79%,为复杂场景下的雷达目标识别提供了有效解决方案。
随着信息化战争形态的发展,雷达因其全天候、远距离观测非合作机动目标的独特优势,在精确制导、反导遥感等领域扮演着关键角色。然而,雷达图像存在分布未知的噪声、高机动目标成像畸变以及姿态敏感性等固有挑战,导致传统基于光学图像的目标检测方法难以直接适用。现有深度学习算法虽在合成孔径雷达(SAR)图像识别中取得进展,但对逆合成孔径雷达(ISAR)图像的研究仍因公开实测数据集匮乏而受限。更本质的问题在于,雷达图像与光学图像在特征表达上的差异尚未被充分重视,这为高精度目标检测带来了巨大困难。
针对上述问题,上海交通大学与上海无线电设备研究所联合团队在《Journal of Systems Engineering and Electronics》发表论文,提出一种改进YOLOv5的雷达目标检测模型。该研究通过三重创新设计:在骨干网络与颈部网络间嵌入坐标注意力(CA)模块实现噪声环境下的特征预提取,采用可变形卷积适应目标形态畸变,并利用中值加权优化的随机加权平均(SWA)方法提升模型鲁棒性。实验表明,新模型在包含3200张卫星ISAR图像的数据集上(训练集70%、验证集10%、测试集20%)实现了90.17%的精确率(P)和83.97%的召回率(R),显著优于YOLOv8、Faster R-CNN等对比模型。
关键技术方法包括:1)通过坐标注意力机制捕获长程空间依赖关系,利用高度与宽度方向的全局池化生成特征编码(公式1-5);2)构建可变形卷积网络,通过可学习偏移量Δpn动态调整卷积核采样区域(公式6);3)改进SWA算法,采用模型参数中值替代均值以规避局部极值干扰(算法1)。实验环境配置为Windows10系统、RTX2060显卡及PyTorch 1.10.0框架。
与YOLOv8(0.8507)、原YOLOv5(0.8380)、Faster R-CNN(0.8066)和SSD(0.7215)相比,本文模型mAP0.5达到0.8562,提升幅度为0.49%-13.47%。结果表明该模型在保持实时性的同时,对噪声和畸变具有更强适应性。
CA模块的mAP0.5(0.8543)较SE(0.8498)和CBAM(0.8277)提升0.26%-2.66%。验证了CA在雷达图像特征定位中的优势。
逐项添加改进模块后,完整模型(CA+可变形卷积+改进SWA)较基线YOLOv5的P值提升4.42%,R值提升3.25%。可视化结果证实新模型在强噪声环境下仍能保持稳定检测置信度。
该研究通过多维度技术创新,解决了雷达图像目标检测中的噪声抑制、畸变适应和模型泛化三大核心难题。CA模块的预提取策略突破了传统注意力机制局限于颈部网络的约束,可变形卷积的采样灵活性为不规则目标检测提供了新思路,而改进SWA算法则为模型收敛稳定性提供了理论保障。这些成果不仅推动了YOLOv5在雷达影像领域的应用边界,更为复杂战场环境下的智能感知系统提供了可靠的技术支撑。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号