摘要
本发明公开了一种由仿真到真实的视觉伺服双臂机器人迁移模仿学习方法,包括:S110,根据真实任务场景构建虚拟仿真场景,并建立二者联系;S120,将采集到的示教机械臂与执行机械臂操作数据在虚拟仿真场景中进行重放和优化,以构建最终训练使用的数据集;S130,设计并实现深度模仿学习网络,深度模仿学习网络的输入包括真实任务场景中获取的视觉数据和示教机械臂各关节电机状态数据,输出为下一个时刻预测的执行机械臂各关节电机状态;S140,将经过充分训练并已收敛的深度模仿学习网络从虚拟仿真场景迁移到真实任务场景中的双臂机器人上。本发明提升了双臂机器人学习网络的探索效率和泛化能力。
技术关键词
双臂机器人
模仿学习方法
关节电机
仿真场景
视觉
编码器
网络
数据
交叉注意力机制
关键点
滑动窗口法
三维模型
机械臂关节
解码器
节点
特征信息编码