摘要
本发明的基于深度强化学习的机器人抓取方法及系统,包括:安装机器人、深度相机,初始化环境模型,构建马尔可夫决策模型;设定机器人的控制方式,结合环境,确定所述状态空间、动作空间;基于融合双重回放缓存机制的深度强化学习算法,为机器人抓取任务提供改进的深度强化学习控制策略;制定训练策略,目标是找到最优策略,使得机器人在完成抓取动态物体任务之后获取到最大奖励总和;在强化学习中,通过双重回放缓存机制,机器人能够更高效地从经验中学习;训练改进的深度强化学习控制策略,部署到机器人,进行机器人抓取移动物体的任务。本发明具有在非结构化环境下机器人移动抓取自主决策能力强、环境适应性高、学习效率高的特点。
技术关键词
机器人抓取方法
移动物体
机器人控制算法
缓存机制
控制策略
深度强化学习算法
深度相机
视觉检测模块
抓取物体
安装机器人
机器人抓取系统
机器人夹持器
动态物体
关节运动速度
神经网络参数
系统为您推荐了相关专利信息
分布式光伏集群
智能控制装置
调度主站
优先级算法
通信单元
电网二次调频
制冷系统
执行控制策略
区域传感器
状态空间模型
协调控制模块
调控系统
控制误差
环境状态信息
舒适度