基于模仿学习的机器人技能持续学习方法和装置

正文

推荐专利

申请号：CN202411975691

申请日期：2024-12-30

公开号：CN119589681B

公开日期：2025-06-24

类型：发明专利

摘要

本公开涉及一种基于模仿学习的机器人技能持续学习方法和装置，所述方法包括：依次针对多个任务中的每个任务，在满足预设终止条件之前循环执行以下操作：将观测图像、状态信息、预先获取的当前任务的文本指令、以及当前任务的技能编码本输入到模仿学习策略网络，预测得到当前时刻机器人的动作信息，其中，当前任务的技能编码本是预先初始化的多个可学习的子技能向量，在具有先前任务的情况下，包含先前任务的技能编码本的技能信息；基于预测得到的机器人的动作信息和专家演示数据中机器人的真实动作信息计算损失；基于损失对模仿学习策略网络和当前任务的技能编码本进行更新。解决了技能选择不灵活、人为设计技能难以抽象子技能层次结构等问题。

技术关键词

持续学习方法机器人注意力状态编码器参数更新模块多模态高斯混合模型文本编码器多层感知机网络解码器图像检查点指令学习装置矩阵数据

基于模仿学习的机器人技能持续学习方法和装置

站点导航

APP 下载