一种基于图生成的视频预训练方法和动作预测方法

正文

推荐专利

申请号：CN202510589263

申请日期：2025-05-08

公开号：CN120542465A

公开日期：2025-08-26

类型：发明专利

摘要

本公开提供了一种基于图生成的视频预训练方法和预测方法。预训练方法包括：基于观察图像构建含有物体顶点和视觉动作顶点的生成图采用图及其历史图估计物体属性，将加入物体属性的图输入图神经网络，生成顶点特征；利用图生成器，基于图像编码、语言指令编码以及所述顶点特征预测未来图序列；利用视频数据集对上述步骤涉及到的网络进行训练，得到图生成模型；利用带动作标签的智能体示范数据集，采用图生成模型，预测智能体视角观察图像的未来图序列；将未来图序列加入带动作标签的智能体示范数据集训练图引导策略。使用本发明能够在视频帧内构建动作信息丰富的可迁移图，并生成未来图以为图引导策略训练提供精确和富有表现力的指导。

技术关键词

预训练方法顶点特征物体动作预测方法图像编码状态编码器视频序列策略视角观察图像在线跟踪算法 ResNet网络多层次历史位置信息标签视觉语义

系统为您推荐了相关专利信息

游戏信息处理方法、装置、设备、存储介质及程序产品

团队游戏信息处理方法账户运动计算机程序指令

多模态档案一体化元数据提取与自动挂接方法

挂接方法数据项标签批量非易失性计算机存储介质

受限网络条件下关键区域高画质视频传输方法及装置

参数标记高清接收端视频传输方法

一种机器人机械手抓取和对接方法、设备、介质及产品

过滤软管机器人机械手对接方法机器人末端位姿力学传感器

一种气象特征图像聚类与模糊融合的非气象目标识别方法

气象图像分割模糊逻辑识别方法模糊隶属度

一种基于图生成的视频预训练方法和动作预测方法

站点导航

APP 下载