一种基于视觉-语言模型的可泛化机器人奖励生成方法

正文

推荐专利

申请号：CN202411663360

申请日期：2024-11-20

公开号：CN119625601A

公开日期：2025-03-14

类型：发明专利

摘要

本发明公开了一种基于视觉‑语言模型的可泛化机器人奖励生成方法，包括：访问包含人类执行不同任务的视频和文本标签的人类数据集，采用视频‑语言对比学习预训练视频‑语言模型；收集机器人成功执行任务的数据和未成功执行任务的数据，构成机器人数据集；将失败视频输入视觉编码器中，以提取失败视频的视觉特征。随后进一步生成对应的失败提示；通过跨领域对比学习将机器人任务数据与人类任务数据对齐，同时改进视频‑语言对比学习，对齐视频和任务描述；训练视频‑语言模型，训练得到的模型将作为机器人奖励函数，将该奖励函数结合强化学习方法以生成任务执行的奖励值。利用本发明，可以提高机器人在多样化的环境中执行广泛的任务的成功率。

技术关键词

视频生成方法强化学习方法收集机器人人类数据视觉特征文本编码器预训练模型标签样本定义模式指令时序算法

系统为您推荐了相关专利信息

一种基于行人动机的自动驾驶系统及控制方法

自动驾驶系统交通路口视频智能驾驶车辆行人识别行人检测

图像生成方法、装置、电子设备及计算机程序产品

对象图像处理模型图像生成方法像素点电子设备配置

监控点位的选取方法、装置、电子设备及可读存储介质

视频分析遗传算法对象电子设备分析模块

眼眶影像诊断报告生成模型构建方法及报告生成方法

影像诊断报告模型构建方法三元组实体图谱

用于检测隔网球类运动中球员的姿态的方法和设备

球员球场人体姿态估计算法相机

一种基于视觉-语言模型的可泛化机器人奖励生成方法

站点导航

APP 下载