摘要
本发明适用机器人运动控制技术领域,提供了一种机器人技能学习方法,该方法包括:基于任务信息和环境信息,采用预设的奖励‑策略协同进化策略对用于指导机器人技能习得的奖励函数和策略模型进行迭代进化,利用进化完成后得到的目标策略模型控制机器人执行任务信息中的目标任务,从而实现在有效减少训练数据需求的同时,显著增强机器人在处理高维任务时的技能学习效果,提升了机器人任务执行的准确性、精度以及效率。
技术关键词
协同进化策略
大语言模型
学习方法
机器人控制单元
融合策略
参数
可读存储介质
学习装置
处理器
存储器
计算机
周期
精度
数据
系统为您推荐了相关专利信息
大语言模型
文本
预测用户满意度
计算机可读指令
关键点
船舶交通流
特征提取方法
轨迹
序列
高斯混合模型
生成动态用户界面
大语言模型
自然语言
SCADA系统
指令