摘要
本公开提供了一种基于图生成的视频预训练方法和预测方法。预训练方法包括:基于观察图像构建含有物体顶点和视觉动作顶点的生成图采用图及其历史图估计物体属性,将加入物体属性的图输入图神经网络,生成顶点特征;利用图生成器,基于图像编码、语言指令编码以及所述顶点特征预测未来图序列;利用视频数据集对上述步骤涉及到的网络进行训练,得到图生成模型;利用带动作标签的智能体示范数据集,采用图生成模型,预测智能体视角观察图像的未来图序列;将未来图序列加入带动作标签的智能体示范数据集训练图引导策略。使用本发明能够在视频帧内构建动作信息丰富的可迁移图,并生成未来图以为图引导策略训练提供精确和富有表现力的指导。
技术关键词
预训练方法
顶点特征
物体
动作预测方法
图像编码
状态编码器
视频
序列
策略
视角观察图像
在线跟踪算法
ResNet网络
多层次
历史位置信息
标签
视觉
语义
系统为您推荐了相关专利信息
团队
游戏信息处理方法
账户
运动
计算机程序指令
挂接方法
数据项
标签
批量
非易失性计算机存储介质
过滤软管
机器人机械手
对接方法
机器人末端位姿
力学传感器