摘要
本发明提供了基于强化学习的手内重新定位系统及方法,涉及机器人学习技术领域,包括动作基元模块和高层决策模块;动作基元模块包括旋转动作基元和翻转动作基元,旋转动作基元和翻转动作基元是使用强化学习在仿真环境中预先训练得到的;高层决策模块,用于确定目标立方体的当前位姿,并根据目标立方体的当前位姿,调度旋转动作基元或翻转动作基元;动作基元模块,用于执行高层决策模块所调度的旋转动作基元或翻转动作基元,基于机械手的传感信息,驱动机械手各关节的执行器操作目标立方体。本发明能够在低成本硬件环境下高效、可靠地完成手内物体的重新定位任务。
技术关键词
基元
立方体
仿真环境
逆运动学
关节控制器
姿态误差
机器人学习技术
决策
定位系统
执行器
视觉
抓取模块
传感
标记
接触点
驱动机械手
物理