摘要
本发明涉及一种含扰动的机械臂轨迹跟踪控制双Q强化学习方法,属于机械臂智能控制技术领域。该方法将采用双Q强化学习方法来解决受干扰的机械臂轨迹跟踪控制问题。设计了一个干扰观测器来估计并抵消外部干扰和模型不准确性的影响,提高机械臂系统的控制精度和干扰抑制能力;设计了一个基于双Q强化学习方法的跟踪控制器,利用双Q学习算法的优越性能,提升系统的动态和稳态性能的同时,保持控制成本;另外利用双Q强化学习方法还解决了传统Q学习方法中遇到的Q值过高的问题。本发明有效利用双Q强化学习方法的优势,在系统含有扰动和不确定因素的情况下,实现机械臂系统对期望轨迹的快速跟踪性能,且具有很好的稳态性能。
技术关键词
强化学习方法
扰动观测器
机械臂系统
轨迹跟踪控制
反馈控制策略
设计跟踪误差
加速度
强化学习策略
矩阵
状态空间方程
干扰观测器
强化学习算法
智能控制技术
定义系统
控制力矩
设计系统
系统为您推荐了相关专利信息
优化控制方法
李雅普诺夫函数
四旋翼无人机姿态
子系统
径向基神经网络
无人机避障方法
障碍物
避碰规则
斥力势场
强化学习方法
轨迹跟踪控制方法
轮式移动机器人
位姿误差
坐标系
参数估计误差
水下机器人
路径跟随控制方法
基体
稳态误差
磁悬浮机器人
振动预测方法
机械臂系统
机械臂末端执行器
多自由度机械臂
薄板