摘要
本发明提供了一种基于元模仿学习的双臂机器人智能搬运方法。该方法包括以下步骤:首先,根据搬运难度进行分级,越光滑、越重的物体等级越高,搬运使用的力越大,由操作者操控双臂机器人执行搬运任务,获取示教数据集,对示教数据集进行预处理,合成专家数据集;其次,运用专家示教数据集进行最大熵逆强化学习训练奖励函数;再次,使用训练出来的奖励函数作为动作指导,采用MAML元强化学习方法,训练出一个泛化能力足够强的双臂搬运策略模型。本发明使双臂机器人可在保持一定效率的情况下,既能成功执行样本之内物块搬运,又能通过少量数据样本的适应,成功执行样本之外物体的搬运任务,相较于传统的双臂机器人搬运规划方法和一般的强化学习机器人搬运算法,提升了双臂机器人在搬运任务上的泛化能力并降低了训练成本。
技术关键词
双臂机器人
搬运方法
示教数据
专家数据库
神经网络参数
策略
物体
轨迹
关节
优化神经网络
学习机器人
强化学习方法
集成专家
操作者
样本
因子
系统为您推荐了相关专利信息
中继节点
边缘计算方法
卸载策略
时延
LEO卫星
示教数据
机器人
学习方法
DTW算法
GMM模型
化设计方法
翼型参数
深度强化学习模型
控制点
物理
双臂机器人
多智能体强化学习
导纳控制器
双机械臂
装配系统