基于多阈值事件视觉的交叉路口行人车辆检测数据集(EBCD)构建与性能基准分析

《IEEE Data Descriptions》:Descriptor: Event-Based Crossing Dataset (EBCD)

【字体: 时间:2025年11月13日 来源:IEEE Data Descriptions

编辑推荐:

  本研究针对传统事件视觉数据集固定阈值限制导致的真实环境适应性不足问题,开发了事件交叉路口数据集(EBCD)。通过采集10个阈值水平(4-75)下的事件图像,系统评估了YOLOv4/YOLOv7/YOLOv10等6种检测架构在不同稀疏度条件下的性能。实验表明阈值T16能最优平衡噪声抑制与特征保留,为动态户外场景下事件相机的自适应检测提供了重要基准。

  
当我们谈论自动驾驶和智能交通系统时,实时准确地检测行人车辆是核心挑战。传统相机像一位勤恳的摄影师,不断拍摄完整画面,但这种方式在高速动态场景中显得笨重——它产生大量冗余数据,消耗巨大算力,在光照剧烈变化时容易"失明"。事件相机(Dynamic Vision Sensor, DVS)的诞生带来了革命性突破,它模仿生物视觉系统,仅捕捉像素亮度变化,像一位敏锐的侦探只记录关键线索,实现了微秒级响应、低功耗和强抗干扰能力。
然而,这位"侦探"有个棘手问题:如何设定触发记录的灵敏度阈值?阈值太低,连树叶晃动都会触发记录,形成信息噪音;阈值太高,又可能错过重要目标特征。现有事件数据集大多采用固定阈值,就像给侦探配备一副无法调节的眼镜,在复杂户外场景中表现僵化。马里兰大学巴尔的摩县分校的研究团队在《IEEE Data Descriptions》发表的论文,正是为了解决这一核心矛盾。
研究人员创造性地构建了事件交叉路口数据集(Event-Based Crossing Dataset, EBCD),首次系统引入多阈值采集框架。他们从南洋理工大学行人数据集中精选33个过马路视频,转换为30,390张事件图像,覆盖10个阈值水平(4/8/12/16/20/30/40/50/60/75)。
通过精细标注7,318个行人车辆边界框,团队建立了首个支持阈值适应性评估的基准平台。
关键技术方法包括:基于NTU行人数据集的33段户外交叉路口视频预处理;Roboflow平台下四人标注团队的标准边界框标注流程;十级阈值(4-75)的事件图像生成算法;以及YOLOv4/YOLOv7/YOLOv10/EfficientDet-b0/MobileNet-v1/HOG等六种检测模型的并行训练验证。
像素活动计算与比较
通过算法1的激活像素检测方法,研究量化了阈值选择对信噪比的影响。
在阈值T4时,90.09%的激活像素位于目标区域外,而T75时这一比例降至5.96%,证明高阈值能有效抑制环境干扰。与室内场景SEFD数据集对比显示,户外环境激活像素密度高出5.2倍,凸显了户外检测的特殊挑战。
现有神经网络架构比较
可视化分析显示,YOLO系列模型在阈值变化时保持稳定检测,而MobileNet-v1在低阈值下因架构限制表现不佳。HOG方法虽在T75有所改善,但始终无法达到50%交并比(IoU)阈值,揭示了传统方法处理事件数据的局限性。
基准测试与技术创新
表III的全面测试数据揭示了阈值T16的平衡优势。
YOLOv10在T0(RGB)取得最佳AP50(98.5%),而YOLOv7在事件数据上表现最稳定。效率分析显示YOLOv4每秒处理16.66帧,适合实时应用,而HOG仅0.42帧/秒证实其计算瓶颈。
训练损失曲线表明,YOLOv7收敛最稳定(损失值0.8833),而EfficientDet-b0波动最大但最终损失最低(0.3732)。
研究结论强调,事件视觉系统的性能高度依赖阈值选择。EBCD数据集通过多阈值框架解决了传统数据集的刚性限制,为自动驾驶、机器人导航等需要适应动态环境的应用提供了关键训练基准。阈值T16被确定为户外场景的最佳平衡点,能在保留目标特征的同时抑制90%的背景噪声。这项工作推动了事件相机从实验室走向真实世界的关键一步,为下一代低功耗、高响应速度的智能视觉系统奠定了数据基础。数据集已通过IEEE DataPort公开,支持后续研究对阈值自适应算法的深入探索。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号