一种基于深度强化学习的机械臂6D位姿抓取方法

AITNT
正文
推荐专利
一种基于深度强化学习的机械臂6D位姿抓取方法
申请号:CN202410772342
申请日期:2024-06-14
公开号:CN118544353A
公开日期:2024-08-27
类型:发明专利
摘要
本发明公开了一种基于深度强化学习的机械臂6D位姿抓取方法,包括:在仿真环境中搭建用于机械臂6D位姿抓取的实验平台;在仿真环境中构建6D位姿抓取网络;初始化经验回放池为空、随机初始化策略网络和价值网络的参数以及目标策略网络和目标价值网络的参数;收集经验样本,并存入经验回放池;当经验样本达到阈值,开始在仿真环境中训练价值网络和策略网络;搭建机械臂实物平台,将仿真环境下训练好的6D位姿抓取网络移植到实物平台,机械臂在真实环境下进行动作决策实现物体抓取。本方法提出的基于深度强化学习的机械臂6D位姿抓取方法,基于在线专家演示的生成增强数据样本,极大丰富了专家经验样本,提高了经验池中高质量样本的比例,采用基于深度神经网络的奖励值评估方法精细评估机械臂的抓取位姿优劣,有效提高了机械臂在非结构化环境中抓取任意位姿物体的成功率。
技术关键词
深度强化学习 抓取方法 仿真环境 样本 末端夹持器 抓取网络 策略 机械臂 3D点云数据 姿势误差 评估网络结构 坐标系 抓取动作 抓取物体 全卷积神经网络 值评估方法 深度相机
系统为您推荐了相关专利信息
1
基于多尺度特征融合的图像语义分割方法、装置及介质
图像语义分割网络 多尺度特征融合 图像语义分割方法 融合特征 解码器
2
图像处理方法、装置、电子设备以及存储介质
视频生成模型 样本 图像处理方法 电子设备 图像处理装置
3
非线性评价模型的解释方法及设备
非线性 变量 样本 特征提取算法 计算机设备
4
变压器故障隐患诊断方法和装置
微处理器 故障检测模型 备份 训练神经网络模型 矩阵
5
基站功率配置方法及装置、计算机程序产品、电子设备
网络性能数据 灰狼优化算法 训练样本数据 时间段 功率配置方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号