摘要
本发明公开了一种基于离线强化学习的无人机自主特技飞行的通用方法,包括收集无人机的历史飞行数据,收集时尽量覆盖无人机飞行中的各种姿态;筛选无人机关键的观测量、动作量,对观测量和动作量进行处理,构建符合马尔科夫决策过程的飞行数据;构建无人机空气动力学网络模型;利用符合马尔科夫决策过程的飞行数据,对无人机空气动力学网络模型进行训练,得到贴合真实数据的无人机空气动力学的网络模型;在贴合真实数据的无人机空气动力学的网络模型中利用强化学习算法训练策略模型;将特定的特技飞行轨迹处理后输入训练后的策略模型,模型输出动作,指导无人机实现特定的特技飞行动作,本方法放弃传统的基于监督学习的虚拟环境克隆,使用基于对抗神经网络和分布对齐损失的优化方法,同时本方法采用双环境检验,避免策略学习中的过拟合问题。
技术关键词
强化学习算法
构建无人机
空气动力学模型
离线
日志记录功能
控制无人机
轨迹
舵面偏角
控制策略
决策
数据
解析日志文件
虚拟仿真环境
强化学习策略
关键点
网络模型训练
系统为您推荐了相关专利信息
动力学建模方法
神经网络模型
飞机
空气动力学模型
翼型
中小型无人机
模拟风场
协同控制方法
风机运行参数
测试场景
新能源电力系统
故障识别方法
大语言模型
深度强化学习算法
气象
代码缺陷检测方法
模糊匹配算法
序列模式识别
强化学习算法
语义
智能审核系统
审核规则
节点
审核模型
分布式强化学习