摘要
本申请涉及机器人控制和人工智能技术领域,公开了一种机器人技能学习方法、装置、机械臂机器人及存储介质,用于解决传统模仿学习模型在长时程预测时复合误差增大,技能学习效果不佳以及控制精度低的问题。机器人技能学习方法包括:采集原始机器人执行待学习任务时的机器人控制训练数据;根据机器人控制训练数据对预设的初始块时序模仿学习模型进行训练,得到目标块时序模仿学习模型;将原始机器人当前时刻的第一机器人控制数据输入目标块时序模仿学习模型,并根据输出的每个动作时序块进行机器人控制,直至待学习任务执行完成;根据预设的奖励函数对待学习任务中每个动作时序块进行评估,根据评估结果对原始机器人进行模型优化,得到目标机器人。
技术关键词
时序
机器人控制
机械臂机器人
学习方法
特征提取网络
样本
学习装置
数据
控制策略
编码器
解码器
视觉
图像
关节
复合误差
可读存储介质
人工智能技术
变量
系统为您推荐了相关专利信息
特征采样方法
统计学习方法
计算机可执行指令
数据
主站系统
动态评估系统
子模块
ResNet网络
注意力机制
孤立森林算法
知识点
命题方法
采集考生信息
报告
构建知识图谱