摘要
本申请属于无人机集群控制技术领域。本申请提供一种基于强化学习的无人机集群协同对抗决策方法。本公开实施例根据己方无人机集群和对手无人机群的对抗场景,提出无人机运动模型和几何态势模型;基于无人机运动模型和无人机之间的几何态势模型,设计无人机生存状态更新规则和对抗任务;将多无人机作战表示为连续空间中的马尔可夫博弈,采用MAPPO算法进行策略迭代优化,设计有效的稀疏奖励函数来指导无人机进行对抗博弈,实现了智能体的学习和集群整体协同对抗的统一,提高了无人机的响应速度,解决了复杂态势环境中奖励函数设计复杂、决策时效性有限等挑战。
技术关键词
无人机集群协同
决策方法
强化学习模型
表达式
多无人机系统
协同控制策略
方位角
设计无人机
规划
运动
策略更新
网络
状态更新
超参数
时效性
系统为您推荐了相关专利信息
决策方法
抽样技术
集成算法
差分隐私保护
深度网络模型
评估分析方法
贝叶斯网络模型
因子
生态系统
植物种类