一种认知大模型在环监督的机器人强化学习训练方法

AITNT
正文
推荐专利
一种认知大模型在环监督的机器人强化学习训练方法
申请号:CN202510714318
申请日期:2025-05-30
公开号:CN120633841A
公开日期:2025-09-12
类型:发明专利
摘要
本发明涉及一种认知大模型在环监督的机器人强化学习训练方法,利用认知大模型在环监督方法闭环训练强化学习模型至强化学习模型收敛,引入认知大模型在环监督方法对强化学习模型的训练过程进行优化,通过任务的完成度以及与任务目标的偏离程度判定是否需要介入强化学习训练,针对不同的训练场景与任务无需使用专家知识进行复杂奖励函数设计,且无需依赖大量复杂交互,加速了机器人的训练过程,实现了机器人灵巧技能学习。
技术关键词
学习训练方法 强化学习模型 机器人 强化学习策略 视觉 强化学习算法 文本 决策 训练场景 指令 掩膜 关键词 残差网络 数据 闭环 表达式 进程 因子
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号