
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于YOLOv8s改进的轻量化交通标志检测模型DP-YOLO:针对小目标检测的优化与性能提升
【字体: 大 中 小 】 时间:2025年05月16日 来源:Digital Signal Processing 2.9
编辑推荐:
为解决自动驾驶场景中交通标志小目标检测精度不足和模型复杂度高的问题,研究人员提出基于YOLOv8s改进的DP-YOLO模型。通过移除大目标检测层、新增小目标检测层,设计DBBNCSPELAN4特征提取模块和PTCSP混合架构,结合W3F_MPDIoU损失函数,在TT100K数据集上实现mAP0.5提升5.8%的同时参数减少77.0%,为边缘端部署提供高效解决方案。
在自动驾驶技术快速发展的今天,交通标志识别系统如同车辆的"交通语言翻译官",其准确性直接关系到行车安全。然而现实场景中,交通标志往往以"迷你尺寸"出现在复杂环境中——不足32×32像素的小标志被树木遮挡、因车速模糊、受光线干扰,传统检测算法就像用渔网捞芝麻,漏检误检频发。更棘手的是,车载设备的算力限制要求模型必须"瘦身",但现有轻量化方案如YOLOv8n、LeYOLO等在压缩参数时,又像过度节食的运动员,牺牲了关键的特征提取能力。这种"检测精度"与"模型轻量"的拉锯战,成为制约自动驾驶落地的关键瓶颈。
针对这一难题,广西民族大学的研究团队在《Digital Signal Processing》发表研究,提出DP-YOLO模型。通过解剖YOLOv8s的结构缺陷,研究人员实施了三项精准"外科手术":首先切除冗余的大目标检测层,移植高分辨率小目标检测层;随后设计DBBNCSPELAN4模块强化特征提取,创新PTCSP架构融合CNN与Transformer优势;最后开发W3F_MPDIoU损失函数提升收敛效率。就像为模型配备"显微镜头"和"节能芯片",在TT100K、GTSDB和CCTSDB数据集上分别实现mAP0.5提升5.8%、2.7%和1.3%,参数量骤降77%。
关键技术包括:1)结构重参数化技术将DBBNCSPELAN4模块的六种卷积分支合并为单一推理结构;2)PTCSP模块采用3:1通道分配策略平衡CNN与Transformer计算开销;3)W3F_MPDIoU融合最小点距(MPDIoU)、困难样本聚焦(Focaler-IoU)和动态加权(WIoUv3)机制;实验使用TT100K数据集9404张图像,按7:2:1划分训练/测试/验证集。
【网络架构革新】移除P5大目标检测层并新增P2检测层,使特征图分辨率从80×80提升至160×160,小目标检测APs提升6.4%,模型体积从22.6MB压缩至5.7MB。如图3所示,改进后的特征图能清晰保留5像素级标志轮廓。
【特征提取优化】DBBNCSPELAN4模块通过1×1卷积与3×3卷积的四种分支组合,在训练阶段增强多尺度特征捕获,推理时转化为单一3×3卷积。相比原C2f模块,参数量减少8.1%的同时,mAP0.5提升0.8%。
【混合架构设计】PTCSP模块将30%通道分配给Transformer分支(MHSA_CGLU结构),70%保留给CNN分支。这种"分而治之"策略使GFLOPs降低3.5%,其中CGLU门控机制增强局部特征建模,DropPath操作防止过拟合。
【损失函数创新】W3F_MPDIoU通过公式LW3F_MPDIoU=rRWIoULF_MPDIoU实现动态加权,其中β=L?IoU/LIoU构建单调聚焦系数。在TT100K数据集上比CIoU提升1.8% mAP0.5,特别对"禁止通行"等稀有标志识别率提高12.3%。
这项研究开创性地实现了"检测精度不降反升,模型体积大幅缩减"的双赢局面。其价值如同为自动驾驶系统打造了专用"显微镜"——既能捕捉毫米级标志细节,又满足车载芯片的严苛算力限制。特别是PTCSP模块中Transformer与CNN的黄金比例分配,为多模态架构设计提供新范式。未来通过TensorRT加速和知识蒸馏技术,有望在Jetson等边缘设备实现毫秒级推理,推动交通标志识别从实验室走向真实复杂路况。
生物通微信公众号
知名企业招聘