摘要
本发明提供一种分层强化学习与组合优化协同的机械臂控制方法及系统,方法包括建立机械臂的环境空间,并获取机械臂的状态、机械臂的动作轨迹数据以及机械臂末端到达的目标位置;通过当前时间步的机械臂的状态在当前策略下选择对应的动作与环境空间进行交互;建立轨迹数据经验池,从轨迹数据经验池中采样出若干个数据样本;基于若干个数据样本对神经网络进行训练,根据训练后的神经网络更新当前策略,通过训练后的神经网络得到机械臂动作的潜向量输出;通过组合优化的方法将环境约束项拼接到潜向量输出上,以得到机械臂在当前状态所需执行的最优动作。本发明能够优化机械臂的动作序列,能够使得机械臂最大程度地提高任务执行的效率和准确性。
技术关键词
分层强化学习
机械臂控制方法
末端执行器
机械臂控制系统
轨迹
数据
策略
加速度
样本
表达式
观察单元
正则化参数
拼接模块
存储单元
电机
序列
系统为您推荐了相关专利信息
复合控制方法
解耦控制器
多任务
人机协同
冗余机器人
高速公路交通事故
车辆运行轨迹
视频
行人数量
分阶段
对象
特征提取网络
多层感知器
计算机执行指令
坐标系
清理机器人
机器人末端工具
参数估计模型
六维力传感器
偏差