面向自动驾驶的高精度能效卷积脉冲神经网络交通标志识别方法

《IEEE Access》:Highly Accurate and Energy Efficient Convolutional Spiking Neural Network for Traffic Sign Recognition

【字体: 时间:2025年12月16日 来源:IEEE Access 3.6

编辑推荐:

  本研究针对自动驾驶系统中交通标志识别(TSR)的高能耗与计算效率瓶颈,提出了一种融合卷积块注意力模块(CBAM)、时间批归一化(BNTT)和余弦退火重启学习率调度器的卷积脉冲神经网络(CSNN)模型。该模型在GTSRB、Belgium TSC、Indian TS及自定义USA数据集上分别达到99.90%、99.78%、99.89%和99.87%的分类准确率,能耗仅相当于传统CNN的4.8%,为智能边缘设备提供了高精度低功耗的TSR解决方案。

  
在自动驾驶技术快速发展的今天,交通标志识别系统已成为高级驾驶辅助系统(ADAS)的核心组件。然而现实道路环境中,驾驶员常因注意力分散、恶劣天气或障碍物遮挡而错过重要交通标志,据世界卫生组织2023年全球道路安全报告显示,每年约有119万人死于交通事故。现有基于卷积神经网络(CNN)的识别系统虽精度较高,但存在计算资源消耗大、能耗高等问题,严重制约其在资源受限的物联网设备中的部署。
针对这一挑战,印度理工学院焦特布尔分校的研究团队在《IEEE Access》发表了一项创新研究,提出了一种兼具高精度与超高能效的卷积脉冲神经网络(CSNN)模型。该模型通过引入脉冲神经网络的生物启发式计算特性,结合多种优化策略,在保持顶尖识别精度的同时,显著降低了系统能耗。
研究人员采用了几项关键技术方法:首先构建了包含3个卷积层、2个全连接层的CSNN基础架构;其次引入卷积块注意力模块(CBAM)增强特征提取能力,通过时间批归一化(BNTT)稳定训练过程;采用替代梯度下降法解决脉冲神经元不可微问题;使用AdamW优化器与余弦退火重启学习率调度器优化训练;并利用时间随机丢弃(DropoutTT)防止过拟合。模型在德国GTSRB(43类)、比利时TSC(62类)、印度TS(15类)及美国自定义(56类)四大数据集上进行验证。
模型架构优化分析
通过系统对比实验证实,BNTT技术将模型准确率从97.85%提升至99.90%,有效解决了脉冲神经网络训练过程中的梯度不稳定问题。CBAM模块的加入使注意力机制能够聚焦于交通标志的关键区域,将识别准确率提升0.29%。优化器对比显示AdamW在分类任务中表现最优,较传统SGD提升超4个百分点。
能效优势量化评估
研究团队从计算复杂度与能耗两个维度进行了严格量化分析。如表4所示,所提CSNN模型仅包含55.5万个可训练参数,计算量(FLOPs)为173.5万次,分别为同等配置CNN模型的25%和4.8%。能耗分析基于45nm CMOS工艺,脉冲神经网络采用累加器(AC)而非CNN的乘加单元(MAC),单次推理能耗仅0.225μJ。
多数据集泛化验证
如图16、18、19、20所示,模型在四大数据集上均达到接近99.9%的识别准确率,显著优于现有文献报道的最佳水平(GTSRB:99.56%、Belgium TSC:97.80%)。特别针对美国交通标志的识别任务,研究团队专门构建包含8440张图像的数据集,验证了模型对不同国家交通标志体系的强泛化能力。
可解释性增强设计
通过梯度加权类激活图(Grad-CAM)可视化技术(图21)表明,结合CBAM的CSNN模型能够准确聚焦于交通标志的关键判别区域,如限速标志中的数字符号部分,有效提升了模型决策的透明度和可信度。
研究结论表明,该CSNN架构成功解决了传统深度学习模型在交通标志识别任务中面临的高能耗与计算效率瓶颈问题。通过BNTT、CBAM等技术的协同优化,在保持脉冲神经网络能效优势的同时,实现了与顶尖CNN模型相媲美的识别精度。该研究为自动驾驶、智能交通系统等边缘计算场景提供了可行的技术路径,未来可进一步探索与轻量化推理模型(TRM)的融合,增强系统的语义理解与解释能力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号