摘要
本发明提供基于强化学习全状态约束控制机械臂轨迹方法及系统,方法包括:建立n自由度旋转关节的刚性机械臂动力学模型;根据动力学模型、状态约束,设计误差转换函数,将有约束的误差e转换为无约束的误差ξ;根据无约束误差ξ的更新率,设计机械臂系统的成本函数;通过成本函数,构建雅可比‑贝尔曼‑哈密顿方程,求解得到最优控制器;利用critic神经网络近似逼近最优成本函数,得到近似最优控制器;根据近似最优控制器,推出近似哈密顿‑雅可比‑贝尔曼方程,与原哈密顿‑雅可比‑贝尔曼做差,梯度下降获得critic网络权值矩阵更新率。本发明解决了不确定性及动态变化场景下、多约束条件下,存在的难以实现机械臂轨迹跟踪、机械臂轨迹跟踪精度较低的技术问题。
技术关键词
状态约束控制
轨迹方法
方程
机械臂系统
逻辑
矩阵
旋转关节
梯度下降法
模块
动态变化场景
网络
李雅普诺夫函数
误差函数
系统误差
定义
多约束条件
轨迹系统
近似误差
系统为您推荐了相关专利信息
逻辑电路
输出驱动器
端子
P型MOS晶体管
输入电路
经验小波变换
电流温度控制器
气体检测系统
非线性最小二乘拟合
DFB激光器
数据传输延迟
监测信息处理方法
健康监测终端
健康监测数据
考勤设备
参数模型构建方法
变量
成分分析
因子
森林资源调查
LSTM模型
滑动窗口机制
动态故障树模型
重构
低压直流断路器