摘要
本发明涉及飞行器制导控制领域,一种拦截三维机动目标的强化学习制导控制一体化方法,包括如下步骤,步骤S1,建立三维弹‑目相对运动学模型,基于目标常见的机动模式,构造面向制导控制的六自由度拦截弹模型;步骤S2,基于现有的深度强化学习理论Actor‑Critic框架结构,确定深度强化学习方法;步骤S3,基于深度强化学习的制导控制一体化设计,搭建神经网络结构,并设计面向智能体训练和学习的状态空间、动作空间、奖励函数等,本发明提出的方法,实现六自由度飞行器外环制导回路和内环姿态控制回路的结合,避免了由于不同回路间时间常数不一致导致的制导性能下降问题。采用强化学习理论形成制导和控制一体化指令,提升了飞行器对外界环境的适应能力。
技术关键词
制导控制一体化
坐标系
深度强化学习方法
六自由度飞行器
神经网络结构
三维弹
飞行器制导控制
确定性策略梯度
姿态动力学模型
强化学习理论
姿态控制回路
强化学习网络
偏角
姿态角速率
弹体
BP神经网络
系统为您推荐了相关专利信息
搅拌摩擦焊工艺
工件
神经网络模型
电主轴系统
机器人设备
图像处理模块
图像分割模型
对象
图像特征向量
图像采集模块
故障诊断方法
储能系统
坐标系
人工神经网络模型
电池仓
扩张状态观测器
四旋翼无人机
非线性
跟踪微分器
控制器