摘要
本发明涉及一种针对态势实时变化的无人机编排方案生成的方法,特别是涉及一种基于掩码向量(Mask Vector)动作屏蔽和深度强化学习算法(Deep Reinforcement Learning)的方案生成方法。首先通过结合新态势的变化构造额定无人机数量匹配的强化学习智能体,通过该智能体获得若满足新态势的编排目标需要的理论无人机数量。然后,结合当前态势下的作战信息构造实际编排配置的强化学习智能体,即结合蓝方的无人机拦截概率选择从什么位置进行目标的额定编排从而完成整体的编排目标,最终实现资源消耗尽量小的情况下完成新态势的蓝方目标的编排。
技术关键词
深度强化学习算法
决策
数据采集效率
生成方法
生成无人机
构建无人机
游戏策略
资源
游戏环境
游戏场景
生成算法
部队
标识
指标