摘要
本发明提供了基于无模型增量式强化学习的带臂无人机悬停稳定控制方法,包括:建立无人机和带载机械臂模型,建立深度强化学习算法框架,初始化神经网络策略,设计分层奖励函数,采集无人机和带载机械臂状态信息,策略神经网络根据采集的状态信息输出增稳控制指令,与PID控制器输出的控制指令进行带参数的权值叠加,得到融合控制律,再将融合控制律输入无人机和带载机械臂模型,解算下一状态信息,利用下一状态信息计算该状态的奖励值,并结合相应动作反馈给深度强化学习算法框架,运行分布式近端优化策略输出策略梯度,计算策略的梯度下降,利用梯度下降更新神经网络,完成策略的更新。本发明能够实时给予指导信息,提升训练效率。
技术关键词
雅克比矩阵
稳定控制方法
坐标系
深度强化学习算法
坐标转换矩阵
策略
方程
正向运动学
带臂无人机
机械臂关节
旋翼
空气阻力系数
螺旋桨
力矩
升力
采集无人机
系统为您推荐了相关专利信息
自动化机械设备
舱门
耐久性测试系统
子系统
视觉定位导航
织物悬垂形态
织物试样
三维模型
基准面
逆向工程技术
地下水流场
地形高程数据
水文地质参数
数字高程模型
三维地质模型
工位机器人
三角面片模型
任务分配方法
表面缺陷检测
模拟退火算法
拆分方法
分割算法
DBSCAN聚类算法
对钢结构
BIM模型数据