
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于场景理解的非线性行人视频追踪方法:动态阈值优化与多特征融合的创新研究
【字体: 大 中 小 】 时间:2025年06月18日 来源:Displays 3.7
编辑推荐:
针对复杂场景下目标检测精度与推理效率失衡、行人遮挡及形变等难题,本研究提出一种融合场景理解与多特征匹配的非线性行人追踪方法。通过动态设置NMS阈值、引入CSPResNet-FPN特征网络及改进GIOULoss 函数,结合匈牙利算法与SIFT特征点匹配,实现MOTA 82.6%、IDF1 80%的高精度实时追踪(22 FPS),显著超越DeepSort性能。
在智能监控领域,行人追踪技术是军事禁区、商场安防等场景的核心需求。然而,现有算法面临两大痛点:固定阈值的非极大值抑制(NMS)策略难以适应不同场景复杂度,导致检测精度与效率失衡;行人形变、遮挡及光照变化易引发追踪漂移。这些问题使得传统方法如DeepSort在实际复杂场景中表现不佳,亟需一种能动态感知环境、融合多维度特征的智能追踪方案。
辽宁省"揭榜挂帅"科技重大专项支持的研究团队在《Displays》发表论文,创新性地将场景理解机制引入追踪框架。该方法首先构建场景复杂度评估体系,通过动态调整NMS阈值实现检测模型的自适应优化;其次,在特征提取阶段采用跨阶段部分残差网络(Cross Stage Partial ResNet, CSPResNet)与特征金字塔网络(FPN)协同架构,增强多尺度特征融合能力;最后,整合卡尔曼滤波预测、匈牙利算法(Hungarian)运动匹配与尺度不变特征变换(SIFT)表面特征匹配,构建抗遮挡追踪系统。关键技术还包括改进的GIOULoss
损失函数以提升边界框回归精度。
研究结果
场景理解与动态阈值优化
通过量化分析图像场景复杂度指标,实验证明动态NMS阈值可使检测模型在拥挤场景下召回率提升12.3%,同时维持22 FPS的实时性能。
特征提取网络改进
CSPResNet-FPN组合相较于传统VGG网络,在Caltech行人数据集上使特征提取速度提升18%,小目标检测AP提高5.2个百分点。
多特征融合追踪
在MOTChallenge测试集中,SIFT特征匹配使严重遮挡场景下的ID切换次数降低37%,匈牙利算法将轨迹关联准确率提升至91.4%。
结论与意义
该研究突破性地将场景理解作为阈值调节依据,首次实现检测模型参数与场景复杂度的动态耦合。CSPResNet-FPN架构有效解决多尺度行人特征提取难题,而运动-外观双特征融合策略显著提升遮挡场景鲁棒性。最终系统在保持实时性的前提下,MOTA指标达82.6%,较基线方法提升9.8个百分点,为智能监控、无人驾驶等领域的多目标追踪提供新范式。值得注意的是,该方法对硬件算力需求仅为同类算法的60%,具备良好的工程落地潜力。
生物通微信公众号
知名企业招聘