综述:无人机群中的碰撞避免:以学习为中心的协作智能视角
《Neurocomputing》:Collision avoidance in UAV swarms: A learning-centric perspective on collaborative intelligence
【字体:
大
中
小
】
时间:2025年11月10日
来源:Neurocomputing 6.5
编辑推荐:
本文系统综述了基于协作智能的无人机群碰撞 avoidance 技术进展,提出六维度分类法,涵盖决策范式、群协调方法、通信架构、学习策略、执行策略及安全机制。重点分析强化学习、联邦学习、神经启发式模型及混合方法,比较其训练架构、可扩展性、实时可行性,并探讨未来研究方向,包括数字孪生、通信感知融合、安全认证等。
随着无人机群(UAV swarm)在关键任务领域的应用日益广泛,碰撞避免成为了确保安全、协调和大规模自主性的重要挑战。本文综述了基于学习的碰撞避免策略,这些策略通过协作智能(collaborative intelligence)在无人机群中得以实现。我们提出了一个六维分类体系,该体系从决策制定范式、群体协调模型、通信架构、学习方法、执行策略以及安全保证机制六个方面对现有方法进行了分类。重点分析了四种主要的学习方法:强化学习(Reinforcement Learning, RL)、联邦学习(Federated Learning, FL)、神经启发模型(neuro-inspired models)和混合方法(hybrid approaches),并详细讨论了它们的训练架构、可扩展性、鲁棒性和实时可行性。结合2019年至2025年初的同行评审文献,我们综合比较了这些方法在轨迹规划、基于视觉的导航、去中心化协调以及多智能体冲突解决等应用背景中的适用性,同时评估了部署复杂性和操作安全之间的权衡。除了具体方法的分析外,本文还突出了关键差异、实际挑战和使能技术,最后讨论了大规模、可验证的无人机群智能的开放挑战和未来方向。
无人机群的应用范围涵盖农业、基础设施监测、监视和灾难管理等领域,近期的综述强调了多无人机协调和大规模安全。在民用和国防领域,学习驱动的感知、通信和机载计算的进步正在加速自主性的发展。然而,大规模部署仍受到空域整合、网络安全和可靠碰撞避免的限制。随着无人机操作规模的扩大,它们越来越多地展现出群体行为特征,其中集体决策和协调引入了额外的可扩展性和安全整合挑战。类似的担忧也在相关群体机器人领域被提出。
本文综述的动机来源于对现有文献的分析,这些文献强调了学习和协作在无人机群碰撞避免中的重要性。我们的分类框架不同于以往的综述,后者主要关注感知管道或环境特定的分类。我们的框架强调了协作使能器(协调、通信和学习)和部署保障(执行和安全保证)作为等价的设计层。这种双视角为评估近期研究提供了一个全面的框架,并建立了从算法设计到可部署系统的连贯性。
本文提出了一种六维分类体系,涵盖了决策制定范式、群体协调方法、通信架构、基于学习的策略、执行策略以及安全保证机制。这些维度反映了近期群体-碰撞-避免文献中的主要设计选择,并映射到实际中协作智能的实施层。这一分类体系在多个研究中被验证,例如,通过中心化、去中心化和混合控制策略,无人机群能够实现复杂的协调行为,同时保持系统层面的一致性和安全保证。
在文献综述中,我们强调了当前研究在分类、实际挑战和使能技术方面的进展。同时,我们指出了现有文献中的一些不足,包括缺乏以学习为中心的群体分类、协作和通信的不足、学习控制器的安全性和保证机制的缺失,以及模拟验证的主导地位。本文的综述不仅填补了这些空白,还提供了全面的框架,用于评估和设计适用于复杂现实环境的无人机群智能系统。
强化学习(RL)是当前无人机群碰撞避免研究的核心方法之一。通过模拟环境中的交互,RL能够生成适应性强的策略,适用于动态、部分可观测环境。然而,RL方法在大规模部署中面临模拟到现实的差距、计算复杂性和训练过程中的样本效率问题。为了克服这些限制,研究者正在探索多种方法,如去中心化RL、强化学习与优化方法的结合,以及使用深度强化学习(DRL)的混合框架。这些方法通过适应性调整,提高了在动态和不可预测环境中的鲁棒性和适应性。
联邦学习(FL)为去中心化协调和边缘/云计算提供了隐私保护的模型共享方案。通过在本地训练并周期性地共享模型更新,FL能够在有限带宽或隐私敏感的环境中实现协同优化。然而,FL方法在非独立同分布(non-IID)数据和群体规模扩展方面仍面临挑战。此外,FL在实时可行性方面仍需进一步研究,尤其是在高密度无人机群中。
神经启发模型(neuro-inspired models)在基于视觉的导航任务中表现出色,通过轻量级、事件驱动的处理方式支持去中心化的实时决策。然而,这些模型在通信密集型群体操作中可能面临训练稳定性、硬件适配性和解释性方面的挑战。为了克服这些限制,研究者正在探索与优化方法、模糊逻辑控制以及多智能体学习的结合,以提高模型的适应性和鲁棒性。
混合方法(hybrid approaches)结合了多种学习和控制范式,以提高碰撞避免的性能。通过将强化学习与基于模型的规划、优化方法或传统控制相结合,这些方法在可扩展性、鲁棒性和实时可行性方面展现出优势。然而,混合方法在训练复杂性和政策整合方面存在挑战,尤其是在多智能体环境中,需要解决非平稳性和信用分配问题。
本文的综述强调了学习方法在实现协作智能中的关键作用。通过分析现有文献,我们识别了不同方法在决策制定、协调、通信和安全保证方面的优缺点。例如,强化学习在动态环境中表现出色,而联邦学习在大规模、隐私保护的群体协调中具有优势。神经启发模型和混合方法则在实时性和模块化设计方面提供了潜在的解决方案。
在应用领域方面,我们总结了不同学习策略在轨迹规划、群体协调、基于视觉的控制、边缘/云计算、预测建模等任务中的适用性。同时,我们探讨了这些方法在训练复杂性、可扩展性和实时可行性方面的权衡。例如,强化学习需要大量的模拟训练,而联邦学习在数据异构性和网络延迟方面面临挑战。
在协作智能方面,我们强调了去中心化决策、群体协调和适应性策略的重要性。通过结合不同的学习方法,无人机群能够实现动态的、适应性的协作,从而提高整体的安全性和效率。然而,现有研究在群体级认知和涌现行为方面仍存在不足,需要进一步探索。
未来的研究方向包括开发更先进的群体智能算法、建立高保真度的数字孪生和模拟平台、实现通信感知学习、制定安全认证和保障机制、促进人-群协同以及提升能量和任务感知的优化。这些方向旨在将无人机群从反应式实体转变为可解释、适应性和安全认证的协作集体,从而实现其在复杂现实环境中的持续应用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号