摘要
本发明属于深度强化学习技术领域,尤其为一种基于DDPG的四旋翼无人机自抗扰控制方法。本发明包括以下步骤:1)根据四旋翼无人机的飞行原理,坐标定义以及旋转矩阵等得到四旋翼无人机的数学模型;2)根据建立的系统模型,设计线性自抗扰控制系统;3)建立基于深度确定性策略梯度算法(DDPG)的深度强化学习框架,包括经验池存放,奖励函数的设计,智能体训练等过程。本发明,通过设计基于DDPG的四旋翼无人机的自抗扰控制器,在DDPG算法中提出适合的奖励函数,使无人机尽快贴近期望轨迹,提高四旋翼无人机系统的跟踪性能、抗干扰性、鲁棒性等性能。
技术关键词
四旋翼无人机系统
数学模型
线性扩张状态观测器
深度强化学习技术
二阶非线性系统
深度确定性策略梯度
表达式
随机噪声
更新网络参数
控制系统
强化学习算法
算法框架
系统为您推荐了相关专利信息
海尔贝克阵列
永磁体结构
轴向被动磁轴承
球面
数学模型
追踪航天器
集群
航天器飞行技术
罗德里格斯参数
姿态动力学模型
锂离子电池
热耦合模型
策略优化方法
恒流充电
强化学习模型