基于多级注意力机制端到端神经网络的道路无损自动损伤检测与去重技术研究

【字体: 时间:2025年05月29日 来源:Engineering Applications of Artificial Intelligence 7.5

编辑推荐:

  针对复杂路面损伤检测精度不足及重复计数问题,研究人员开发了融合多级注意力机制(MLAB)的YOLOv5-DCN网络,结合加权欧氏距离与余弦相似度去重算法。该技术使RDD-2020数据集mAP@0.5提升5.1%,F1值提高4%,在自建重复损伤数据集(DRDD)中实现94.29%去重准确率,推动了深度学习在道路养护工程中的实用化进程。

  

道路安全是交通基础设施管理的核心议题,而路面裂缝、坑洞等损伤的早期检测直接关乎行车安全与养护成本。传统人工检测效率低下,半自动方法依赖人工标注,全自动检测车则成本高昂。尽管基于YOLOv3、RetinaNet等深度学习的方法已取得进展,但在RDD-2020等基准测试中,现有模型的F1值普遍低于0.68,且视频帧分析导致的重复计数问题长期未解。

针对这一技术瓶颈,山东大学联合江苏高校的研究团队在《Engineering Applications of Artificial Intelligence》发表研究,提出融合多级注意力机制的端到端解决方案。该工作通过三阶段技术路径实现突破:首先采用改进的可变形卷积(DCN)适应裂缝的细长形态特征;其次设计PaveIoU损失函数优化边界框回归;最后引入多级注意力模块(MLAB)增强特征提取能力。实验采用RDD-2020国际公开数据集及自建DRDD数据集验证,通过加权欧氏距离与余弦相似度联合算法实现损伤去重。

Convolutional kernels
研究团队针对裂缝的形态特性,在YOLOv5骨干网络中嵌入可变形卷积层(Deformable Convolutional Networks),使卷积核能自适应调整采样位置。相比标准3×3卷积,改进后的DCN对横向/纵向裂缝的检测召回率提升12.7%。

Algorithms for road damage de-duplication method
基于YOLOv5s轻量化架构,团队构建了包含7维特征的损伤指纹序列:包括损伤类型、中心坐标、长宽比、面积占比及纹理复杂度。通过阈值优化的相似度匹配算法,在DRDD数据集上实现94.29%的去重准确率,误判率低于3.2%。

Road Damage Dataset 2020 (RDD-2020)
在包含日、印、捷等多国数据的RDD-2020测试中,YOLOv5-DCN的mAP@0.5达81.4%,较基准模型提升5.1个百分点。特别对网状裂缝的检测F1值从0.63提升至0.71,证明MLAB模块对复杂纹理特征的捕获优势。

Conclusion and perspective
该研究证实:1)形态自适应卷积核与多尺度特征融合能有效提升细长型损伤检测精度;2)联合距离度量算法可解决工程中重复计数痛点。技术方案已应用于济南市智慧交通项目,为道路养护决策提供分钟级响应支持。未来研究将探索三维点云数据与多模态传感器融合,进一步突破夜间及雨雪环境下的检测瓶颈。

(注:全文数据及方法均引自原文,专业术语如mAP@0.5指交并比阈值0.5时的平均精度,MLAB为Multi-Level Attention Block缩写,DRDD即Duplicate Road Damage Dataset)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号