摘要
本发明涉及一种基于深度强化学习的战斗机底层飞行控制方法,所述方法包括以下步骤:S1、根据仿真环境设计飞控的目标更新方式和终止条件函数;S2、根据仿真环境构建战斗机控制的状态空间、动作空间和奖励函数;S3、基于PPO算法搭建深度神经网络模型;S4、训练基于PPO算法的战斗机底层飞行控制模型。本发明的控制方法使智能体可以在完成对战、追踪等高层任务决策时,只需专注于高级任务规划,从而减少对底层飞机控制基本决策的训练,使算法更容易收敛,减少学习成本。
技术关键词
飞行控制方法
深度强化学习
仿真环境
飞行器
深度神经网络模型
驾驶杆
坐标系
策略更新
速度
定义
动作交互
飞机
样本
判断算法
计数器
处理器
机体