一种多级奖励和动作掩码联合优化的机械臂推抓协同方法

正文

推荐专利

申请号：CN202511036716

申请日期：2025-07-25

公开号：CN120588237A

公开日期：2025-09-05

类型：发明专利

摘要

本发明公开了一种多级奖励和动作掩码联合优化的机械臂推抓协同方法，包括：借鉴经典深度Q学习推抓协同系统结构，引入推动和抓取掩码限制无效区域探索以提高训练效率；以推动前后变化区域中关联物体的分散度为评判依据，设计多级推动奖励，更准确地评估推动效果；在抓取过程中引入垂直方向扰动和水平方向扰动，根据抓取动作抗扰动的能力设计了多级抓取奖励，准确量化抓取动作性能。搭建仿真训练场景，机械臂采用深度Q学习算法与仿真环境不断交互，同时根据网络决策动作类型，动态选择并更新对应的网络参数。仿真环境中训练好的网络模型可直接移植到实物平台，显著提高了密集杂乱场景中抓取成功率。

技术关键词

协同方法抓取动作仿真环境深度Q学习深度图抓取网络像素点深度相机矩阵机械臂逆运动学贪婪策略训练场景抓取物体决策坐标

系统为您推荐了相关专利信息

一种基于高斯溅射优化的RGB-D SLAM深度补全与定位方法

不确定性参数像素深度图定位方法颜色

三维建模方法及其装置、烹饪设备和存储介质

三维建模方法三维模型对象旋转烤盘控制烹饪设备

一种基于稀疏贝叶斯推断的无人机电力巡检避障系统

无人机电力巡检稀疏贝叶斯避障系统栅格地图数字地图信息

阻燃材料表面缺陷图像识别方法、装置、设备及存储介质

缺陷图像识别阻燃材料语义特征矩阵多视角

基于深度图推理的软件安全隐式威胁主动识别方法、装置和介质

主动识别方法深度图指令流特征提取模型软件

一种多级奖励和动作掩码联合优化的机械臂推抓协同方法

站点导航

APP 下载