摘要
本发明提供一种基于强化学习的旋翼无人机飞控训练、迁移方法,具体包括如下步骤:步骤100、在配置完成的高保真仿真环境中设置多种典型的训练任务以及奖励函数;步骤210、从构建的任务中按照优先级采样一批任务,使用强化学习方法进行策略训练;步骤220、在训练过程中加入扰动构造多种环境,包括对态势扰动、对动力学扰动,训练带扰动的策略从而提高策略的适应性与鲁棒性;步骤300、在验证场景中进行策略性能验证,并基于验证数据对策略进行迁移修正,最终部署到旋翼无人机上。本发明采取多融合态势信息,实现旋翼无人机在各个飞行阶段的低中高速灵巧控制,并往实机迁移。
技术关键词
旋翼无人机
迁移方法
策略
强化学习方法
仿真环境
强化学习算法
深度神经网络
迁移系统
鲁棒性
典型
随机噪声
阶段
仿真器
场景
轨迹
模块
数据
板卡
格式