机械臂强化学习奖励确定方法及存储介质

正文

推荐专利

机械臂强化学习奖励确定方法及存储介质

申请号：CN202510394932

申请日期：2025-03-31

公开号：CN119952727B

公开日期：2025-07-22

类型：发明专利

摘要

本申请提供了一种机械臂强化学习奖励确定方法及存储介质，其中，该方法包括：获取机械臂的当前任务数据；根据当前任务数据以及通用的视觉语言模型，确定当前任务数据对应的至少一个子目标序列以及子目标隐藏状态；根据前一时刻的各粒子的更新后子目标隐藏状态，确定非初始时刻的各粒子的子目标输入状态，并根据各粒子的子目标输入状态以及各粒子在非初始时刻的权重参数，确定非初始时刻的子目标完成状态；在当前决策时刻，根据当前决策时刻的子目标完成状态以及前一决策时刻的子目标完成状态，确定当前决策时刻的奖励结果。本申请能够隔离视觉语言模型感知误差与策略优化过程，降低对视觉语言模型在复杂场景理解层面的要求。

技术关键词

粒子机械臂序列视觉方程决策参数数据感知误差可读存储介质图像计算机语句策略处理器场景

系统为您推荐了相关专利信息

基于图像识别的商品挑选与搬运装置

搬运装置夹持爪辅助支架伸缩板传送带系统

一种基于机械臂的无人机回收装置及其气囊缓冲控制方法

无人机回收装置缓冲控制方法法兰连接件泄压阀门回收控制技术

自走式鲜食葡萄多臂多齿疏花果机器人

鲜食葡萄末端执行器履带式行走装置橡胶履带深度相机

基于人工智能的大数据处理分析系统

数据处理分析系统标签标记元素识别模块

基于多源数据融合的生态地质动态监测与评估方法

生态土壤有机质含量综合评价模型指数代表

机械臂强化学习奖励确定方法及存储介质

站点导航

APP 下载