摘要
本发明提出了一种基于改进TD3算法的复飞操纵方法,属于航空航天技术领域;包括如下步骤:包括如下步骤:S1:搭建舰载机模型;S2:构建分段激活结构的神经网络模型,利用神经网络模型构建目标策略网络和策略网络,进一步得到改进的TD3强化学习算法;S3:对改进的TD3强化学习算法进行参数配置,从舰载机模型中选择参数来配置状态观测量、动作输出量和奖励函数;S4:设计基于改进的TD3强化学习算法的复飞操纵模型;S5:计算复飞区参数;S6:根据计算得到的复飞区参数,确定复飞决策方法。本发明能输出最优的升降舵舵偏指令,实现迎角保持,无需依赖复杂的预设控制律或大量人工调参,符合实际复飞操作的约束和要求。
技术关键词
强化学习算法
神经网络模型构建
策略
决策方法
飞机升降舵
舰载机着舰
参数
航空航天技术
轨迹
样条
分段
偏差
框架
表达式
非线性
建材
数学
系统为您推荐了相关专利信息
对象存储系统
内存
LRU算法
存储器
存储控制器
训练样本数据
特征提取模型
文本特征提取方法
标签
强化学习算法
智能评估方法
智能模型
联邦学习方法
接口调用请求
图谱
图像分类方法
分类预测模型
多层感知机
样本
学习方法