一种认知大模型在环监督的机器人强化学习训练方法

正文

推荐专利

申请号：CN202510714318

申请日期：2025-05-30

公开号：CN120633841A

公开日期：2025-09-12

类型：发明专利

摘要

本发明涉及一种认知大模型在环监督的机器人强化学习训练方法，利用认知大模型在环监督方法闭环训练强化学习模型至强化学习模型收敛，引入认知大模型在环监督方法对强化学习模型的训练过程进行优化，通过任务的完成度以及与任务目标的偏离程度判定是否需要介入强化学习训练，针对不同的训练场景与任务无需使用专家知识进行复杂奖励函数设计，且无需依赖大量复杂交互，加速了机器人的训练过程，实现了机器人灵巧技能学习。

技术关键词

学习训练方法强化学习模型机器人强化学习策略视觉强化学习算法文本决策训练场景指令掩膜关键词残差网络数据闭环表达式进程因子

一种认知大模型在环监督的机器人强化学习训练方法

站点导航

APP 下载