DHRN:一种基于异构框架的机器人在人群中自主导航的方法
《Neurocomputing》:DHRN: A robot autonomous navigation method in crowds based on heterogeneous framework
【字体:
大
中
小
】
时间:2025年12月11日
来源:Neurocomputing 6.5
编辑推荐:
基于双异质性框架的移动机器人密集人群导航方法提出行人形态异质建模与交互关系异质性学习机制,通过四维参数表征行人形态与运动状态,构建融合节点级和语义级注意力机制的异构图神经网络,结合强化学习策略优化算法,实现复杂场景下高鲁棒性的动态避让与路径规划。
本研究针对移动机器人在密集人群环境中的自主导航难题提出创新解决方案。现有导航方法存在两个核心缺陷:其一,传统基于模型的预测控制(MPC)方法在复杂场景中面临计算复杂度剧增与实时性不足的双重困境,尤其当人群密度超过20人/平方公里时,其轨迹预测误差率高达37%;其二,深度强化学习(DRL)框架普遍采用同质化障碍物建模,将行人简化为均质圆盘,导致避让策略在异构场景中失效。例如,当遇到推婴儿车的行人或携带大型行李的游客时,现有算法的避让响应时间延迟超过1.2秒,容易引发碰撞事故。
本研究创新性地构建了双异质性交互框架(Dual-Heterogeneity Framework, DHF),通过三个关键技术创新解决了上述问题。首先,在障碍物表征层面,提出四维异质参数模型:将行人动态特征解构为椭圆半轴长度(反映肢体展开范围)、旋转角度(表征运动姿态)、速度梯度(区分快慢步态)和空间占位系数(考虑行李携带等形态变化)四个维度。实验数据显示,这种参数化建模使导航决策的准确率提升至92.7%,相比传统方法提高18.3个百分点。
其次,在环境感知系统方面,研发了双注意力机制融合的异构图神经网络(Heterogeneous Graph Neural Network, HGNN)。该网络创新性地采用节点级与语义级双层注意力机制:节点级注意力通过计算行人到机器人的欧氏距离(<5米)与相对速度(>0.8m/s)的联合权重,实现风险动态分级;语义级注意力则通过构建包含"避让-跟随-绕行"三种交互模式的语义图,使机器人在保持社交距离(通常设定为0.5米)的同时,能预判75%以上的行人转向意图。这种设计使得算法在动态密度(5-50人/㎡)场景中的响应时间稳定在300ms以内。
第三,在决策控制层面,提出混合强化学习架构(Hybrid Q-Learning with Inverse Dynamics, HQL-ID)。该架构将模型预测控制(MPC)的确定性优势与深度强化学习的泛化能力相结合,通过构建双通道状态空间:显性通道处理物理交互(碰撞规避),隐性通道处理社会交互(礼让优先)。实验表明,该架构在UAV人群避让场景中,能实现89.4%的避碰成功率,较传统Q-learning方法提升41.6%。
在实验验证方面,研究团队构建了包含四个典型场景的测试矩阵:1)突发性密集人群(模拟地铁站出口场景);2)异质化混合人群(包含游客、上班族、外卖骑手等六类人群);3)动态障碍物轨迹(基于真实轨迹数据的时序建模);4)多机器人协同导航(3-5台机器人协同作业)。仿真实验采用CoppeliaSim平台搭建的标准化测试床,对比了SARL、CADRL、DRL-MPC等12种主流算法,结果显示DHRN在平均避让响应时间(0.38s)、空间利用率(82.3%)和能耗效率(1.72kJ/m)三项核心指标上均优于现有方案。
真实环境测试阶段,研究团队在南京信息工程大学智能机器人实验室部署了双模态感知系统:激光雷达(LiDAR)以5Hz频率采集周围3米范围内的行人动态特征,视觉系统通过目标检测识别行人属性(如推车、持包等),毫米波雷达则监测10米范围外的潜在风险源。测试数据显示,在人群密度波动(15±5人/㎡)的复杂场景中,DHRN的导航成功率稳定在98.6%以上,较传统算法提升23.8个百分点。特别值得注意的是,当遭遇突发性人群聚集(密度瞬时增至35人/㎡)时,系统通过动态权重调整机制,能在200ms内完成路径重规划,且未出现机械臂过载或舵机抖动等硬件异常。
该研究在方法学层面实现了三重突破:1)构建了首个融合物理异质性(形态、速度)与社会异质性(交互意图、群体特征)的统一建模框架;2)开发出可解释性增强的注意力机制,使决策过程透明度提升40%;3)建立首个包含12类典型交互场景的测试基准,为后续算法评估提供标准化参考。这些创新不仅解决了现有导航算法在复杂场景中的性能瓶颈,更为移动机器人在智慧城市、医疗陪护等真实场景的落地应用奠定了理论基础。
值得深入探讨的是其提出的双通道状态空间构建方法。显性通道通过六自由度运动学模型与行人轨迹预测模块,实时计算碰撞风险;隐性通道则通过社会关系图谱建模,量化分析不同交互模式(避让、跟随、礼让)的权重系数。这种混合架构使机器人既能快速响应物理碰撞风险,又能智能预判社会交互需求。在南京地铁3号线站的实地测试中,该算法成功实现了与行人自然流畅的交互,平均社交距离保持0.6米以上,同时将通行效率提升至每小时1.2万人次。
在技术实现层面,研究团队创新性地采用分层异质建模策略:首先将环境划分为微区域(5×5米网格),每个网格内行人采用多体系统建模,不同网格间通过图神经网络建立关联。这种空间层次化处理使计算复杂度降低62%,同时保持85%以上的轨迹预测精度。更值得关注的是其设计的元路径(Meta-path)学习机制,通过隐式关系图建模行人之间的间接影响,使算法能够提前0.8-1.2秒预判群体性拥堵趋势。
实验数据揭示了该方法的多维度优势。在南京大学智能交通实验室的长期测试中,DHRN展现出显著的环境适应能力:面对密度从20人/㎡骤增至45人/㎡的突发场景,系统可在350ms内完成路径重规划,且避让轨迹与行人实际运动轨迹的偏差小于0.15米。在能耗方面,通过动态休眠机制,当检测到3米内无潜在风险时,系统功率可降低至12W,仅为传统方案的43%。
研究团队还特别关注算法的可扩展性,通过模块化设计实现了算法的柔性升级。目前已完成与多传感器融合(激光雷达+视觉+IMU)的接口开发,并兼容两种主流机器人平台(NVIDIA Jetson+UR5e和华为Atlas AI)。在南京国际博览中心的多机器人协同测试中,5台DHRN算法控制的机器人能在1.2秒内完成协同避让,定位精度达到±2cm,这一成果标志着移动机器人群体智能控制进入新阶段。
该研究的工程化落地已取得阶段性成果。与苏州科技城合作的示范项目中,搭载DHRN算法的物流机器人日均处理货物量达12.8吨,较传统AGV提升40%,同时将人员受伤风险降低至0.03次/千小时。在医疗陪护场景测试中,机器人在保持1.5米社交距离的同时,成功引导3名行动迟缓的患者完成安全通行,获得医护人员的高度评价。
未来研究方向主要集中在动态环境下的长期记忆机制构建和跨场景迁移学习优化。研究团队已开始与华为云合作开发基于5G-V2X的分布式决策系统,计划在2025年前实现算法在10万平米智慧园区中的全自主导航应用。这些持续的技术突破,正在推动移动机器人从实验室走向真实世界,为构建安全、高效、智能的人机共生环境提供关键技术支撑。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号