一种基于改进多线程PPO强化学习的机械臂抓取方法及系统

正文

推荐专利

申请号：CN202510037188

申请日期：2025-01-09

公开号：CN119704196B

公开日期：2025-11-28

类型：发明专利

摘要

本发明公开了一种基于改进多线程PPO强化学习的机械臂抓取方法及系统，方法包括：初始化环境状态；多个工作子线程开始并行工作，获取机械臂的初始状态信息，并将其输入到Actor策略网络，Actor策略网络采用改进的PPO强化学习算法进行数据收集；将收集的数据放入到经验池中，计算出所有的优势值；对优势值进行正则化处理，同时对奖励进行缩放处理；对Actor策略网络和Critic评价网络进行更新；根据Actor策略网络输出的最新动作指令，控制机械臂的关节运动和夹爪动作。本发明通过改进奖励函数、优势值正则化和奖励缩放方法改进PPO算法，并利用多线程并行计算提高算法的训练效率和机械臂的抓取性能，使机械臂能够在复杂环境下快速、准确地抓取目标物体。

技术关键词

机械臂抓取方法强化学习算法网络策略机械臂抓取系统机械臂关节多线程并行计算并行工作数据收集方法机械臂夹爪距离信息缩放方法物体模块因子

系统为您推荐了相关专利信息

基于主题感知语境学习的事件因果关系识别方法及系统

识别方法主题训练样本集检索策略预训练语言模型

一种可信设备的虚拟网络通信方法及虚拟网络系统

虚拟网络设备虚拟网络通信方法网络堆栈虚拟网络系统主机

大小模型协同驱动的AIOps多任务调度方法及系统

协同调度策略指标指数时序节点

一种面向通信网络基站资源调度的在线多任务优化方法

基站资源调度面向通信网络任务调度模型多任务在线

一种超薄石英晶片结构、制备方法及石英谐振器

超薄石英晶片石英晶片尺寸石英谐振器平台强度

一种基于改进多线程PPO强化学习的机械臂抓取方法及系统

站点导航

APP 下载