一种机械手视觉策略模型训练方法、操纵方法及系统

正文

推荐专利

申请号：CN202410750857

申请日期：2024-06-12

公开号：CN118493396A

公开日期：2024-08-16

类型：发明专利

摘要

本发明提供了一种机械手视觉策略模型训练方法、操纵方法及系统。机械手视觉策略模型训练方法包括：获取多个人手操纵物体视频；提取多条参考轨迹；强化学习训练基于状态的策略学习模型，在强化学习训练中，利用参考轨迹计算奖励函数；对基于状态的策略学习模型进行多次回滚，获得视觉训练数据，利用视觉训练数据对机械手视觉策略模型进行训练，在训练过程中，将初始三维场景点云作为机械手视觉策略模型的输入，机械手视觉策略模型输出规划控制信号，基于规划控制信号对应轨迹和回滚动作轨迹计算损失，根据损失调整机械手视觉策略模型的网络参数。本发明使机械手操纵更为自然，无需任何特权对象信息，增强了实际应用能力。

技术关键词

模型训练方法策略视觉物体轨迹语义分割模型阶段信号机械手控制系统图像人手机器人指尖采集机械手网络规划视频检测器姿态估计

一种机械手视觉策略模型训练方法、操纵方法及系统

站点导航

APP 下载