基于动作分支架构价值优势学习的机械臂抓取方法及系统

正文

推荐专利

申请号：CN202411714365

申请日期：2024-11-27

公开号：CN119283036A

公开日期：2025-01-10

类型：发明专利

摘要

本发明公开了一种基于动作分支架构价值优势学习的机械臂抓取方法及系统，该方法包括：将机械臂抓取任务建模为马尔可夫决策问题；基于动作空间，引入VA学习算法，搭建动作分支结构的主网络和目标网络；基于贪婪策略，对所述主网络和目标网络进行训练，并累积经验回放池；根据实际场景进行设置，结合贪婪策略和所述经验回放池，完成目标抓取任务。该系统包括：建模模块、网络构建模块、机械臂训练模块。通过使用本发明，使用基于动作分支架构的深度学习算法探索确定性策略，能够更好的处理机械臂的离散状态动作空间，进而提高控制性能。本发明可广泛应用于机械臂控制领域。

技术关键词

机械臂抓取方法贪婪策略分支网络机械臂抓取系统机械臂抓取装置场景深度学习算法回放方法模块处理器参数坐标系程序存储器因子代表

基于动作分支架构价值优势学习的机械臂抓取方法及系统

站点导航

APP 下载