摘要
本发明公开了一种充电枪插拔任务执行方法、装置、机器人及存储介质,涉及计算机运动控制领域。该方法包括:根据机器人执行历史充电枪插拔任务时的历史初始观测图像、历史移动操作原语和历史任务执行情况对初始策略网络进行离线训练,得到预训练策略网络;获取机器人执行当前充电枪插拔任务时的当前初始观测图像,根据预训练策略网络对当前初始观测图像进行预测,得到当前移动操作原语;根据当前移动操作原语对预训练策略网络进行在线训练,得到目标策略网络;根据目标策略网络得到新充电枪插拔任务对应的控制总量,根据控制总量控制机器人执行新充电枪插拔任务。这样,离线训练和在线训练后所得的目标策略网络可在线适应新的充电枪插拔任务。
技术关键词
策略
网络
机器人
离线
图片
图像
总量
在线
执行装置
处理器
数值
模块
可读存储介质
存储器
计算机
数据
参数
视觉
运动
系统为您推荐了相关专利信息
注意力神经网络
流水线模数转换器
码字
校准方法
增益误差
动态门控
声波
地层孔隙压力
密度
计算机执行指令
清扫机器人系统
管片模具
多关节机械手
清扫机构
工业