
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多智能体共享Q学习的协同疏散引导方法研究
【字体: 大 中 小 】 时间:2025年06月27日 来源:Engineering Applications of Artificial Intelligence 7.5
编辑推荐:
为解决紧急疏散中路径规划效率低、出口利用不均衡等问题,研究人员提出了一种基于多智能体共享Q-learning(Multi-agent Shared Q-learning)的协同疏散框架。该研究通过分层智能体架构优化领导者路径规划,结合距离、密度、时间及路径选择频率等因子设计奖励函数,并采用RVO(Reciprocal Velocity Obstacle)模型验证。实验表明,该方法显著缩短总疏散时间(TET),提升出口利用率,为公共安全领域提供了创新性解决方案。
在大型公共活动日益频繁的背景下,紧急疏散效率直接关系到公众生命安全。然而,现有疏散系统常因行人盲目跟随导致出口拥堵与资源浪费,尤其在复杂建筑环境中,非传统路径常被忽视。针对这一难题,山东大学的研究团队在《Engineering Applications of Artificial Intelligence》发表了一项创新研究,提出基于多智能体共享Q学习的协同疏散引导方法,通过智能体协作与动态路径优化,显著提升了疏散效率。
研究采用三项关键技术:1)分层多智能体框架(Hierarchical Multi-agent Framework),整合实时疏散信息管理与动态路径规划;2)共享Q学习算法(Shared Q-learning),通过局部Q表聚合生成全局知识,以距离、密度、时间及路径选择频率四因子设计奖励函数;3)基于RVO(Reciprocal Velocity Obstacle)的群体动力学模型,模拟行人运动并验证系统有效性。
分层多智能体框架
研究设计了三层智能体架构:环境感知层收集实时数据,决策层通过共享Q学习生成全局路径,执行层由群体领导者引导成员。该结构实现了疏散信息的动态协同管理。
共享Q学习算法
通过定义路径选择频率、拥堵度及通行时间等决策因子,构建奖励函数驱动Q表更新。实验显示,该方法使领导者路径奖励值提升23.7%,有效平衡出口负载。
RVO模型验证
仿真实验中,系统将总疏散时间(TET)缩短18.4%,且出口利用率标准差降低至0.12,证明其能缓解拥堵并优化资源分配。
研究结论表明,该框架通过智能体协作与动态路径规划,解决了传统疏散中信息孤岛与路径低效问题。其创新性体现在:1)将局部经验升华为全局策略的共享Q学习机制;2)分层架构实现疏散流程的模块化管控;3)RVO模型验证了理论在实际运动动力学中的适用性。未来研究可进一步探索异构群体行为与三维环境下的扩展应用。
生物通微信公众号
知名企业招聘