一种基于视觉-语言模型的可泛化机器人奖励生成方法

AITNT
正文
推荐专利
一种基于视觉-语言模型的可泛化机器人奖励生成方法
申请号:CN202411663360
申请日期:2024-11-20
公开号:CN119625601A
公开日期:2025-03-14
类型:发明专利
摘要
本发明公开了一种基于视觉‑语言模型的可泛化机器人奖励生成方法,包括:访问包含人类执行不同任务的视频和文本标签的人类数据集,采用视频‑语言对比学习预训练视频‑语言模型;收集机器人成功执行任务的数据和未成功执行任务的数据,构成机器人数据集;将失败视频输入视觉编码器中,以提取失败视频的视觉特征。随后进一步生成对应的失败提示;通过跨领域对比学习将机器人任务数据与人类任务数据对齐,同时改进视频‑语言对比学习,对齐视频和任务描述;训练视频‑语言模型,训练得到的模型将作为机器人奖励函数,将该奖励函数结合强化学习方法以生成任务执行的奖励值。利用本发明,可以提高机器人在多样化的环境中执行广泛的任务的成功率。
技术关键词
视频 生成方法 强化学习方法 收集机器人 人类 数据 视觉特征 文本编码器 预训练模型 标签 样本 定义 模式 指令 时序 算法
系统为您推荐了相关专利信息
1
一种基于行人动机的自动驾驶系统及控制方法
自动驾驶系统 交通路口视频 智能驾驶车辆 行人识别 行人检测
2
图像生成方法、装置、电子设备及计算机程序产品
对象 图像处理模型 图像生成方法 像素点 电子设备配置
3
监控点位的选取方法、装置、电子设备及可读存储介质
视频分析 遗传算法 对象 电子设备 分析模块
4
眼眶影像诊断报告生成模型构建方法及报告生成方法
影像诊断报告 模型构建方法 三元组 实体 图谱
5
用于检测隔网球类运动中球员的姿态的方法和设备
球员 球场 人体 姿态估计算法 相机
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号