基于决策树的多轮无人机空战动态博弈决策方法研究
《Journal of Systems Engineering and Electronics》:Multi-Round Dynamic Game Decision-Making of UAVs Based on Decision Tree
【字体:
大
中
小
】
时间:2025年12月03日
来源:Journal of Systems Engineering and Electronics 2.1
编辑推荐:
为解决多轮空战对抗中的动态决策难题,南京航空航天大学团队开展了基于决策树的无人机多轮动态博弈决策研究。该研究构建了包含策略集、态势信息与机动决策的动态博弈模型,通过态势优势函数与支付矩阵求解纳什均衡,并引入决策树算法优化单轮机动决策。仿真结果表明,该方法能有效提升多轮对抗中的态势优势,为智能空战决策提供了新思路。
在现代军事科技领域,无人机空战自主决策技术因其零伤亡、高机动性等独特优势成为研究热点。然而,当前空战决策研究多聚焦于单轮对抗场景,难以满足实际作战中连续博弈的需求。多轮对抗过程中,决策复杂度呈指数级增长,传统算法往往束手无策。更棘手的是,空战决策缺乏如围棋般的固定规则,使得深度学习等人工智能技术难以直接应用。这一瓶颈严重制约了无人机在复杂空战环境中的作战效能。
针对这一挑战,发表于《Journal of Systems Engineering and Electronics》的最新研究提出了一种融合决策树与博弈理论的创新解法。该研究首次将多轮动态博弈模型引入无人机空战决策,通过构建红蓝双方策略集、态势信息与机动决策的完整博弈框架,实现了从单轮博弈到多轮连续博弈的理论突破。研究团队创新性地将决策树分类算法应用于机动决策优化,使无人机能够根据实时战场态势自适应调整战术,逐步积累对抗优势。
研究采用的关键技术方法主要包括:基于线性规划法的纳什均衡求解、CART决策树分类算法、无人机运动学建模以及多轮动态支付矩阵构建。通过50秒时长仿真实验,在二对四的对抗场景下验证了方法的有效性。
通过建立包含距离、高度、速度、角度等参数的态势评估体系,构建了量化优势函数。其中速度优势函数定义为:
当VRik/VBjk≤0.6时取0.1,在0.6-1.5区间内线性变化,≥1.5时取1.0。综合优势函数通过加权融合态势、性能与收益三类指标,为博弈决策提供量化依据。
通过构建支付矩阵fak=[fapqk]r×l,将空战决策转化为矩阵博弈问题。利用线性规划法求解纳什均衡解(x1k,...,xrk),当期望收益vk<0时触发决策树干预机制。该设计确保了算法在劣势态势下的自主调整能力。
采用CART算法构建二元决策树,以无人机位置、速度、俯仰角、偏航角等8维特征为输入,7种基本机动动作为输出。通过Gini系数最小化原则进行节点分裂,生成最优机动决策序列。验证结果显示决策树模型准确率达95%,显著优于传统方法。
在二对四的对抗案例中,初始期望收益为-0.167的红方经过13轮博弈后转为正值0.004。紧急场景测试表明,当蓝方突然增援一架无人机时,该方法仍能保持决策稳定性。与QPSO(量子粒子群优化)和D-S(Dempster-Shafer)算法的对比实验显示,本方法将获胜所需对抗轮次减少约30%,且获胜概率提升15%以上。
研究表明,通过决策树与动态博弈的深度融合,无人机能够实现多轮对抗中的渐进式优势积累。该方法突破了传统单轮决策的局限性,为智能空战决策提供了可解释、可验证的解决方案。特别值得关注的是,研究首次将无人机运动方程(公式14-15)与决策树算法结合,实现了机动决策与动力学约束的有机统一。未来研究可进一步探索不完全信息条件下的博弈决策机制,推动空战智能决策向更复杂场景拓展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号