摘要
本发明涉及一种融合控制律模型的固定翼飞机控制策略持续优化方法。所述方法包括:在融合控制律模型的固定翼飞机控制器上获取其完成速度矢量控制的专家数据,将专家数据放入示例数据库进行离线模仿学习,输出离线控制策略。利用自课程学习算法由易到难的挑选目标,基于此目标采样训练数据,并通过在线强化学习算法对离线控制策略进行在线持续优化,得到最优目标控制策略。根据最优目标控制策略采样目标轨迹,使用预设的数据更新算子更新示例数据库。根据目标轨迹的对称轨迹与数据增强算子二次更新示例数据库中的专家数据。将已更新的专家数据作为下一轮训练的专家数据进行离线模仿学习。采用本方法能够提高固定翼飞机的速度矢量控制精度和实效性。
技术关键词
固定翼飞机
控制策略
离线
持续优化方法
控制加速踏板
轨迹
强化学习算法
数据更新
强化学习模型
在线
课程学习方法
方位角
集成学习算法
固定翼无人机
控制器
高斯混合模型
速度
种子
系统为您推荐了相关专利信息
板材冷却装置
温度采集模块
焊接热源模型
接触式温度传感器
液氮喷淋装置
混合励磁电机
充放电控制方法
飞轮储能系统
双闭环控制
飞轮转子
光电调制器
闭环控制策略
激光束
透光率
激光发生器
代码系统
设备控制装置
设备配置模块
数据采集装置
搭建模块