基于机器学习的德日行人过街行为预测与模型可迁移性研究
《IEEE Transactions on Intelligent Vehicles》:Predicting Pedestrian Crossing Behavior in Germany and Japan: Insights Into Model Transferability
【字体:
大
中
小
】
时间:2025年12月08日
来源:IEEE Transactions on Intelligent Vehicles 14.3
编辑推荐:
本文针对现有行人行为预测模型缺乏跨国可迁移性的问题,研究人员通过虚拟现实模拟器采集德国和日本的数据,系统比较了行人间隙选择、斑马线使用及轨迹预测的差异。研究发现日本行人更为谨慎,选择更大的过街间隙;神经网络(NN)在间隙选择和斑马线使用预测中表现最优,随机森林(RF)在轨迹预测中效果最佳,并提出基于无监督聚类的方法提升模型可迁移性。该研究为智能交通系统在不同国家的安全部署提供了重要理论支撑。
在城市交通系统中,行人是相对脆弱的参与者,尤其是在没有交通信号灯控制的无信号交叉口,行人与车辆之间的互动充满了不确定性。准确预测行人过街行为——例如,他们选择在多大的车流间隙中穿过马路、是否会使用斑马线、以及他们的具体行走轨迹——对于开发安全的智能驾驶系统和智能交通基础设施至关重要。然而,一个长期被忽视的挑战是,大多数现有的预测模型都是在单一国家收集的数据集上训练和评估的,忽略了不同国家之间可能存在的文化、行为习惯等差异。一个理想的智能系统应当能在不同国家都安全有效地运行,这就要求模型具备良好的“可迁移性”,即在一个国家训练的模型能够较好地适应另一个国家的场景。为了弥补这一研究空白,一项发表在《IEEE Transactions on Intelligent Vehicles》上的研究,将目光投向了德国和日本,深入探究了这两个国家行人的过街行为差异,并系统评估了多种机器学习模型的预测能力与跨国可迁移性。
为了回答上述问题,研究人员开展了一项基于虚拟现实(VR)模拟器的严谨研究。他们利用了一项先前在德国萨尔布吕肯和日本东京进行的研究所收集的数据。该实验使用头戴式VR设备和动作捕捉系统,让参与者在受控的虚拟街道环境中(包含双向两车道交通、斑马线和其他虚拟行人)自由移动并完成过马路任务。这种方法安全地避免了真实世界中可能发生的碰撞风险,并能精确记录各种交互参数。研究最终从每个国家的60名参与者中获得了大量有效试验数据(德国3547次试验,日本3398次试验)。研究主要预测三个核心行为:在无非斑马线场景下的间隙选择行为(回归任务)、在斑马线场景下的斑马线使用决策(分类任务)以及行人的过街轨迹(回归任务)。输入特征主要包括事件发生前可观测的行人-车辆交互信息,如行人等待时间(Tw)、行人平均步行速度(Vp)、错过的车辆间隙数量(Ncb, Nef等)和最大错过间隙(Mcb, Men等)。对于轨迹预测,还加入了行人进入道路瞬间的附加信息,如与邻近车道车辆的距离(Dn, Df)和速度(Vcn, Vcf)以及距斑马线的距离(Dz)。研究采用了线性模型、支持向量机(SVM)、随机森林(RF)和神经网络(NN)等多种机器学习算法进行建模和比较,并特别设计了模型可迁移性评估(在一国数据上训练,在另一国数据上测试)以及利用无监督聚类方法来提升模型性能的方案。
研究发现,德国和日本行人的间隙选择行为存在显著差异。虽然两国行人选择间隙的中位数都是6.5秒,但德国数据表现出更大的变异性(四分位距IQR为3.0秒),而日本数据则更为集中(IQR为2.0秒)。这表明德国行人的行为更为多样和复杂。神经网络(NN)模型在预测德国数据时表现最佳(平均绝对误差MAE为1.075秒),而线性回归模型对日本数据预测最好(MAE为1.030秒),暗示德国数据包含更多非线性关系。
行为分析揭示了关键影响因素。日本行人通常更谨慎:他们等待时间更长(中位数12.7秒 vs 德国9.52秒),错过的车辆间隙更多,并且最终选择接受的间隙也普遍大于德国行人。随着错过间隙数量的增加或错过间隙的增大,两国行人都倾向于接受更小的间隙(即做出风险更高的选择)。然而,当等待时间延长时,行人反而倾向于选择稍大的间隙,表明更长的等待时间与更谨慎的行为相关。行走速度更快的行人倾向于选择更短的间隙。此外,群体行为对两国行人都有影响,他们会倾向于跟随领路行人所选择的间隙(无论是安全的还是风险的)进行过街。在模型可迁移性上,NN模型表现最好,其重要的预测特征在两国间保持一致,这有助于其良好的跨国表现。通过无监督聚类方法整合两国数据后训练的模型,取得了最佳的平均预测性能(平均绝对百分比误差MAPE为17.5%)。
在预测行人是否使用斑马线方面,神经网络(NN)模型同样表现最优,在德国和日本数据上的准确率(ACC)均超过94%。线性模型(如逻辑回归和SVM)更关注近车道未使用的有效间隙数量(Nen),而非线性模型(RF和NN)则更重视行人等待时间(Tw)。
研究发现,当近车道未使用的有效间隙数量增多或行人等待时间延长时,预测斑马线使用的难度会增加,因为决策变得更复杂。然而,NN模型在所有情况下都保持了较高的准确率。此外,使用斑马线的行人通常接受的间隙小于不使用斑马线的行人,这表明当有较大间隙可用时,行人可能更倾向于不严格使用斑马线。日本行人在无论是否使用斑马线的情况下,接受的间隙都大于德国行人,再次印证了其谨慎性。在模型可迁移性评估中,NN模型同样表现最佳。当尝试构建适用于两国的统一模型时,简单地将两国数据合并进行联合训练(Joint Training)获得了最高的平均准确率(95.23%)。
轨迹预测任务采用了独特的方法,不依赖于行人过去的轨迹信息,仅使用交互特征作为输入。研究人员首先对轨迹进行了无监督聚类分析。当聚类数设为2时,聚类结果与行人是否使用斑马线的标签高度吻合(日本数据准确率达99.4%,德国为97.4%),这表明日本行人通常在进入道路前就已决定是否使用斑马线,而部分德国行人可能在过街过程中才改变主意。
平均轨迹图显示,日本使用斑马线的行人轨迹更偏向左上角,表明决策更早;德国不使用斑马线的行人轨迹更靠近斑马线,显示出犹豫。仅使用事件前特征时,NN模型表现较好;但当加入行人进入道路时的附加特征后,随机森林(RF)模型的预测误差显著降低,表现最佳(平均位移误差ADE为0.418米)。直接过街或明确使用斑马线的轨迹更容易预测,而犹豫不决的轨迹(中间集群)预测误差较大。在可迁移性方面,RF模型展现了最强的跨国适应能力。通过利用斑马线使用标签或聚类信息来指导模型训练,能够有效提升轨迹预测的准确率。
综上所述,本研究通过严谨的虚拟现实实验和系统的机器学习分析,深刻揭示了德国和日本行人在无信号交叉口过街行为的异同,并证实了神经网络在间隙选择和斑马线使用预测、随机森林在轨迹预测上的优越性。研究最重要的贡献之一在于系统评估了模型的跨国可迁移性,并创新性地提出利用无监督聚类方法来提升模型的泛化性能。这些发现不仅增进了我们对不同文化背景下行人行为的理解,而且为开发能够在全球范围内安全、可靠部署的下一代智能交通系统和自动驾驶汽车提供了关键的算法见解和实践指南。未来工作可考虑引入生成模型或更复杂的序列模型(如LSTM、Transformer)来进一步捕捉和预测行人更复杂的行为模式。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号