摘要
本申请提供了一种基于对抗式模仿学习的机器人智能决策控制方法,属于自动控制技术领域,包括:获取机器人的专家演示数据,并基于视觉语言预训练模型对所述专家演示数据对应的图像数据进行语义特征提取,得到所述专家演示数据中每条轨迹数据的语义特征;基于所述语义特征和生成对抗模仿学习策略构建教师模型组;获取所述教师模型组中的多个教师模型与单一学生模型之间的蒸馏损失;基于所述蒸馏损失将所述多个教师模型的知识迁移至所述单一学生模型,并基于所述学生模型进行机器人智能决策控制。采用本申请技术方案能够有效地克服单一策略模型的局限性,从而提升机器人智能决策策略的多样性和泛化能力。
技术关键词
教师
机器人
语义特征提取
学生
预训练模型
数据
蒸馏
轨迹特征
图像
计算机设备
视觉
自动控制技术
可读存储介质
特征提取模块
策略
处理器
存储器
系统为您推荐了相关专利信息
越障机器人
车轮装置
机体
姿态传感器
陆空两用机器人
运动状态参数
运动控制方法
机器人
足端轨迹
运动控制装置