机器人技能学习方法、装置、设备及存储介质

AITNT
正文
推荐专利
机器人技能学习方法、装置、设备及存储介质
申请号:CN202411521330
申请日期:2024-10-29
公开号:CN119647552B
公开日期:2025-11-04
类型:发明专利
摘要
本发明适用机器人运动控制技术领域,提供了一种机器人技能学习方法,该方法包括:根据学习提示信息,利用大语言模型生成辅助奖励组件函数,根据由学习提示信息中的若干奖励组件函数和辅助奖励组件函数构成的奖励组件函数集合构建多分支价值网络,基于各价值分支的权重系数,利用多分支价值网络对策略网络进行迭代式的策略训练,直至策略网络的目标函数收敛,利用策略网络对机器人技能学习进行指导,从而通过结合大语言模型的智能决策能力和多分支价值网络的细粒度反馈,提高强化学习中的策略学习效率和整体性能,确保策略优化过程中能够适应不同的技能习得需求,能应对不同的环境以及复杂的机器人任务,提升了任务执行的准确性、精度以及效率。
技术关键词
策略 大语言模型 多分支 网络 机器人 学习方法 可读存储介质 学习装置 处理器 存储器 计算机 频率 决策 精度 参数
系统为您推荐了相关专利信息
1
一种基于模型预测的房车内部CO特征智能预警方法
智能预警方法 GRU神经网络 房车 车厢 发动机节气门开度
2
一种基于Bhattacharyya距离与Tanimoto相似度的全参考图像质量评价方法
评价方法 图像 ResNet网络 特征提取模块 底层视觉特征
3
微调应用于泛半导体领域的大语言模型的方法及装置
SPARQL查询 训练语料库 自然语言 半导体 语句
4
一种多源威胁情报隐私融合处理方法及系统
指标 跨模态 实体 字段 组织
5
一种高压开关柜的触头压力测试装置
压力测试装置 高压开关柜 定位移动单元 神经网络模型 控制模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号