生物启发神经网络融合中枢模式发生器:解锁四足机器人多技能运动的新突破

《Scientific Reports》:Bio-inspired neural networks with central pattern generators for learning multi-skill locomotion

【字体: 时间:2025年03月25日 来源:Scientific Reports 3.8

编辑推荐:

  为解决四足机器人运动控制难题,研究人员开展基于中枢模式发生器(CPG)的神经网络研究,实现多技能运动,提升机器人适应性。

  

生物启发神经网络融合中枢模式发生器:解锁四足机器人多技能运动的新突破

在科技飞速发展的当下,机器人正逐渐深入人们生活的各个角落。尤其是四足机器人,凭借其独特的灵活性和适应性,在复杂环境作业、救援探险等诸多领域展现出巨大潜力。然而,让四足机器人实现稳定且高效的运动并非易事,这背后涉及到诸多难题。
传统的深度强化学习(DRL)方法在训练四足机器人运动时,常依赖外部周期性相位输入来产生节律性运动模式。但这种方式存在明显弊端,外部相位输入的设计要么需要人工精心调整,要么得借助额外的学习组件,这不仅增加了系统设计的复杂性,还使得训练过程变得繁琐,容易引入次优性。与此同时,如何让机器人在面对复杂多变的现实环境时,既能实现稳定的节律性运动,又能具备在跌倒后迅速恢复的能力,成为了亟待攻克的关键问题。
为了突破这些困境,重庆大学等多机构的研究人员展开了深入研究。他们提出了一种全新的生物启发神经网络架构 ——MLP-CPG(多层感知器 - 中枢模式发生器),旨在利用 CPG 的固有节律性,为四足机器人打造更加敏捷、动态的运动能力。该研究成果发表在《Scientific Reports》上,为四足机器人运动控制领域带来了新的曙光。
在研究过程中,研究人员主要运用了以下关键技术方法:以 Unitree Go1 四足机器人为实验平台,在仿真和现实场景中开展实验;选用 Pybullet 作为物理引擎构建仿真环境;CPG 控制器基于 Kuramoto 模型进行建模;采用 Soft Actor Critic(SAC)算法训练策略,并结合双 Q 学习(Double Q Learning)更新 Q 网络;引入多种正则化项优化网络训练。
研究人员对 MLP-CPG 网络与手工调整 CPG 参数的网络进行了对比。通过学习曲线和速度跟踪性能分析发现,MLP-CPG 网络在无需过多人工调优的情况下,性能略优于手工调整的网络。这表明 MLP-CPG 网络具有更强的自主学习能力,能够更好地适应不同的运动需求。
在多技能行为研究方面,MLP-CPG 网络展现出卓越的能力。它可在单一策略内实现节律性运动和非节律性跌倒恢复两种技能,且能自动判断机器人是否跌倒并执行恢复动作。在模拟实验中,机器人能在 1.5 秒内完成跌倒恢复,恢复后还能精准跟踪目标速度。这一成果打破了传统方法中需要多个独立策略分别控制运动和跌倒恢复的局限,大大提升了机器人运动控制的集成度和流畅性。
研究人员还对 Go1 机器人在多种复杂地形和不同条件下的性能进行了评估。在不平坦地形实验中,机器人在地形不平度达到 0.15 米时仍能保持一定的运动和跌倒恢复能力;面对低摩擦地面,即使摩擦系数降至 0,机器人仍有较高的跌倒恢复成功率,只是运动性能会在摩擦系数降至 0.2 时显著下降;对于高达 30 毫秒的驱动延迟,机器人的跌倒恢复行为仍可执行,但运动行为在延迟超过 6 毫秒时会受到较大影响;随着负载增加,机器人运动和跟踪目标速度的难度增大;在上坡 15° 和下坡 -20° 的斜坡上,机器人运动性能明显下降。不过,经过训练的策略能让机器人适应多种复杂地形,充分验证了其鲁棒性和适应性。
研究人员在硬件实现环节进行了验证。利用卡尔曼滤波器估计速度,并将其与脚部运动估计的速度融合。实验结果表明,该策略在草地、软床垫、地毯等多种真实地形上都能成功实现跌倒恢复,且在遇到外部干扰时,机器人能迅速做出敏捷反应,恢复到稳定的直立姿态。同时,机器人在执行各种速度指令时,能实现从跌倒恢复到运动的平滑过渡,进一步证明了该策略在实际应用中的有效性。
通过一系列研究,研究人员成功构建了 MLP-CPG 网络架构,实现了 CPG 和 MLP 参数的联合优化。这一成果不仅解决了传统方法依赖外部相位输入的问题,还将运动和跌倒恢复技能集成于单一策略网络,显著提升了四足机器人的运动性能和环境适应性。
然而,该研究也存在一些有待改进的地方。比如,当前策略主要依靠本体感受进行盲目运动,缺乏视觉输入,这限制了机器人在如楼梯等需要精确脚步放置的复杂地形中的导航能力。此外,由于板载计算机计算能力有限,策略在外部计算机上运行并通过 WiFi 与板载计算机通信,导致无线通信延迟。针对这些问题,研究人员计划在未来升级板载计算机,并将策略直接部署到机器人上,同时引入视觉信息,以提升机器人在复杂环境中的运动能力。
总体而言,这项研究为四足机器人运动控制提供了创新性的解决方案,其成果对于推动机器人在复杂环境中的应用具有重要意义,有望为未来机器人技术的发展开辟新的方向。

娑撳娴囩€瑰宓庢导锔炬暩鐎涙劒鍔熼妴濠団偓姘崇箖缂佸棜鍎禒锝堥樋閹活厾銇氶弬鎵畱閼筋垳澧块棃鍓佸仯閵嗗甯扮槐銏狀洤娴f洟鈧俺绻冩禒锝堥樋閸掑棙鐎芥穱鍐箻閹劎娈戦懡顖滃⒖閸欐垹骞囬惍鏃傗敀

10x Genomics閺傛澘鎼isium HD 瀵偓閸氼垰宕熺紒鍡氬劒閸掑棜椴搁悳鍥╂畱閸忋劏娴嗚ぐ鏇犵矋缁屾椽妫块崚鍡樼€介敍锟�

濞嗐垼绻嬫稉瀣祰Twist閵嗗﹣绗夐弬顓炲綁閸栨牜娈慍RISPR缁涙盯鈧鐗哥仦鈧妴瀣暩鐎涙劒鍔�

閸楁洜绮忛懗鐐寸ゴ鎼村繐鍙嗛梻銊ャ亣鐠佹彃鐖� - 濞e崬鍙嗘禍鍡毿掓禒搴n儑娑撯偓娑擃亜宕熺紒鍡氬劒鐎圭偤鐛欑拋鎹愵吀閸掔増鏆熼幑顔垮窛閹貉傜瑢閸欘垵顫嬮崠鏍掗弸锟�

娑撳娴囬妴濠勭矎閼崇偛鍞撮摂瀣鐠愩劋绨版担婊冨瀻閺嬫劖鏌熷▔鏇犳暩鐎涙劒鍔熼妴锟�

相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 急聘职位
    • 高薪职位

    知名企业招聘

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号