机器人技能学习方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202411521330

申请日期：2024-10-29

公开号：CN119647552B

公开日期：2025-11-04

类型：发明专利

摘要

本发明适用机器人运动控制技术领域，提供了一种机器人技能学习方法，该方法包括：根据学习提示信息，利用大语言模型生成辅助奖励组件函数，根据由学习提示信息中的若干奖励组件函数和辅助奖励组件函数构成的奖励组件函数集合构建多分支价值网络，基于各价值分支的权重系数，利用多分支价值网络对策略网络进行迭代式的策略训练，直至策略网络的目标函数收敛，利用策略网络对机器人技能学习进行指导，从而通过结合大语言模型的智能决策能力和多分支价值网络的细粒度反馈，提高强化学习中的策略学习效率和整体性能，确保策略优化过程中能够适应不同的技能习得需求，能应对不同的环境以及复杂的机器人任务，提升了任务执行的准确性、精度以及效率。

技术关键词

策略大语言模型多分支网络机器人学习方法可读存储介质学习装置处理器存储器计算机频率决策精度参数

系统为您推荐了相关专利信息

一种基于模型预测的房车内部CO特征智能预警方法

智能预警方法 GRU神经网络房车车厢发动机节气门开度

一种基于Bhattacharyya距离与Tanimoto相似度的全参考图像质量评价方法

评价方法图像 ResNet网络特征提取模块底层视觉特征

微调应用于泛半导体领域的大语言模型的方法及装置

SPARQL查询训练语料库自然语言半导体语句

一种多源威胁情报隐私融合处理方法及系统

指标跨模态实体字段组织

一种高压开关柜的触头压力测试装置

压力测试装置高压开关柜定位移动单元神经网络模型控制模块

机器人技能学习方法、装置、设备及存储介质

站点导航

APP 下载