基于极少量扫描帧的LiDAR点云移动物体高效分割方法研究

《IEEE Open Journal of Signal Processing》:Efficient Moving Object Segmentation in LiDAR Point Clouds Using Minimal Number of Sweeps

【字体: 时间:2025年12月01日 来源:IEEE Open Journal of Signal Processing 2.7

编辑推荐:

  本文针对自动驾驶环境中LiDAR点云移动物体分割(MOS)计算量大、依赖多帧数据和预定义类别等问题,提出了一种名为2DPASS-MOS的创新方案。该研究通过跨模态知识迁移技术,在训练阶段融合相机与LiDAR数据,推理阶段仅需1-2帧LiDAR点云即可实现移动物体分割。实验表明,该方法在SemanticKITTI和Apollo数据集上达到最先进性能,且具备实时处理能力,为自动驾驶系统提供了更高效的动态环境感知解决方案。

  
在自动驾驶技术飞速发展的今天,LiDAR传感器因其不受光照条件影响的优势,成为环境感知的核心部件。然而,移动物体分割(Moving Object Segmentation, MOS)作为自动驾驶安全导航的关键技术,长期以来面临着重大的技术挑战。传统方法往往需要连续处理多达10帧的LiDAR点云数据(约50-100万个点),计算负担沉重,且严重依赖预先构建的环境地图。更令人担忧的是,这些方法通常限定在已知的移动物体类别(如车辆、行人等),一旦遇到未知类别的移动物体(如动物),就可能造成严重的识别盲区。
针对这些痛点,匈牙利机器感知研究实验室的ZOLTAN ROZSA团队在《IEEE Open Journal of Signal Processing》上发表了一项突破性研究。他们提出了一种名为2DPASS-MOS的创新框架,实现了"极简帧数"下的高效移动物体分割。这项技术的核心思想令人惊叹:仅需1-2帧LiDAR扫描数据,无需任何地图先验知识,就能准确识别移动物体,这好比让自动驾驶系统具备了"一眼识动态"的非凡能力。
研究团队采用了一种巧妙的跨模态知识迁移策略。在训练阶段,模型同时学习LiDAR点云和对应的相机图像特征,让LiDAR模态从视觉模态中"汲取"关于物体运动状态的隐含知识。例如,模型可以学会识别行人肢体姿态的差异、车辆在道路与停车场的不同状态等运动线索。而在实际推理(应用)阶段,系统仅需LiDAR点云输入,充分发挥LiDAR不受光照条件影响的优势。
关键技术方法包括:(1)基于2DPASS架构的跨模态知识迁移,通过多尺度融合实现模态间特征对齐;(2)针对移动物体分割任务重新设计的三类别(静态/动态/忽略)损失函数;(3)多帧实例分割算法,利用语义信息对目标级运动状态进行决策;(4)测试时增强(TTA)策略提升预测稳定性。所有实验均在SemanticKITTI和Apollo真实自动驾驶数据集上进行验证。
研究结果
性能对比分析
在SemanticKARTTI验证集上的测试结果显示,2DPASS-MOS在单帧输入(N=1)情况下达到66.0%的交并比(IoU),显著优于其他需要多帧输入的方法。当使用两帧输入(N=2)时,性能进一步提升至77.8%,超越了当前所有已发表的实时MOS方法。特别是在Apollo数据集上的跨域测试中,未经任何微调的模型直接达到80.6%的IoU,证明了方法的强泛化能力。
定性结果展示
通过可视化对比可以发现,2DPASS-MOS在复杂场景中表现出色。如图3所示,传统方法容易将停在路边的车辆误判为移动物体,或漏检缓慢移动的车辆,而2DPASS-MOS能够准确识别这些边界情况。这种优势源于方法不依赖显著位移作为运动判断依据,而是从外观特征中学习运动规律。
消融实验验证
系统组件的有效性通过详尽的消融实验得到验证。如表4所示,跨模态知识迁移、多帧扩展和实例分割每个组件都带来性能提升。特别值得注意的是,语义信息在跨域测试(Apollo数据集)中发挥关键作用,说明模型学会了可迁移的环境知识。
敏感性分析
研究还深入分析了关键参数的影响。如图4所示,当实例分割使用的帧数(K)增加时,性能持续提升且计算开销增长平缓(每增加1帧最多增加9ms处理时间)。相比之下,其他方法的性能随输入帧数减少而急剧下降。测试时增强(TTA)的投票数优化为单帧12次、双帧1次,在精度和效率间取得最佳平衡。
实时性能评估
运行时分析表明,单帧配置(112ms)是测试方法中最快的,双帧配置(225ms)也满足LiDAR典型10Hz采集频率的实时要求。相比之下,当前性能最好的MF-MOS需要877ms,难以满足实时应用需求。
结论与展望
2DPASS-MOS研究证明了极简帧数LiDAR移动物体分割的可行性,开创了移动物体分割的新范式。该方法不仅实现了最先进的性能指标,更在计算效率、泛化能力和实用性方面取得显著突破。其技术意义主要体现在三个方面:首先,通过跨模态知识迁移实现了单模态高效推理,为多传感器协同学习提供了新思路;其次,摒弃了对预定义物体类别的依赖,增强了系统对未知动态物体的识别能力;最后,极简帧数要求大幅降低了计算负担,为资源受限的嵌入式平台部署提供了可能。
这项研究为自动驾驶环境感知系统提供了更灵活、高效的解决方案,特别适合对实时性要求极高的应用场景。未来研究方向包括进一步验证方法在遮挡场景下的鲁棒性,扩展对更广泛未知类别的识别能力,以及探索从其他自动驾驶传感器进行知识迁移的可能性。随着自动驾驶技术向更高等级发展,这种高效、通用的移动物体分割方法必将发挥越来越重要的作用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号