摘要
本发明公开的一种无人机自主机动博弈决策方法,属于机动决策技术领域,该方法可以通过如下步骤实现:步骤1:构建单智能体三自由度位置智能控制器,建立无人机三自由度运动模型、强化学习博弈环境;步骤2:基于三自由度位置控制器构建博弈机动决策算法和机动博弈决策框架;步骤3:基于改进近端策略优化算法的博弈多智能体训练流程,初始化各智能体策略网络、价值网络,结合强化学习的自学习能力、深度神经网络处理高维状态特征构成无人机在对抗机动决策中可选取的机动策略集;步骤4:在强化学习博弈环境中训练后,将各智能体观测状态输入至训练好的策略神经网络,机动协同不同载机雷达间的融合,实现无人机机动博弈场景下的博弈机动决策任务。
技术关键词
博弈决策方法
无人机
三自由度运动
策略
位置控制器
训练深度神经网络
偏角
决策算法
循环神经网络模型
智能控制器
参数
飞机
训练数据量
深度强化学习
坐标系
场景
粒子群算法
系统为您推荐了相关专利信息
智能调度方法
深度强化学习算法
时延
任务调度
服务器
健康检测系统
终端设备
主站
电力系统智能监测技术
多核微处理器
显示车辆标识
图像
智能驾驶系统
电子设备
处理器
干眼
知识库管理
决策
权重分配策略
历史数据回归分析