一种基于图生成的视频预训练方法和动作预测方法

AITNT
正文
推荐专利
一种基于图生成的视频预训练方法和动作预测方法
申请号:CN202510589263
申请日期:2025-05-08
公开号:CN120542465A
公开日期:2025-08-26
类型:发明专利
摘要
本公开提供了一种基于图生成的视频预训练方法和预测方法。预训练方法包括:基于观察图像构建含有物体顶点和视觉动作顶点的生成图采用图及其历史图估计物体属性,将加入物体属性的图输入图神经网络,生成顶点特征;利用图生成器,基于图像编码、语言指令编码以及所述顶点特征预测未来图序列;利用视频数据集对上述步骤涉及到的网络进行训练,得到图生成模型;利用带动作标签的智能体示范数据集,采用图生成模型,预测智能体视角观察图像的未来图序列;将未来图序列加入带动作标签的智能体示范数据集训练图引导策略。使用本发明能够在视频帧内构建动作信息丰富的可迁移图,并生成未来图以为图引导策略训练提供精确和富有表现力的指导。
技术关键词
预训练方法 顶点特征 物体 动作预测方法 图像编码 状态编码器 视频 序列 策略 视角观察图像 在线跟踪算法 ResNet网络 多层次 历史位置信息 标签 视觉 语义
系统为您推荐了相关专利信息
1
游戏信息处理方法、装置、设备、存储介质及程序产品
团队 游戏信息处理方法 账户 运动 计算机程序指令
2
多模态档案一体化元数据提取与自动挂接方法
挂接方法 数据项 标签 批量 非易失性计算机存储介质
3
受限网络条件下关键区域高画质视频传输方法及装置
参数 标记 高清 接收端 视频传输方法
4
一种机器人机械手抓取和对接方法、设备、介质及产品
过滤软管 机器人机械手 对接方法 机器人末端位姿 力学传感器
5
一种气象特征图像聚类与模糊融合的非气象目标识别方法
气象 图像分割 模糊逻辑 识别方法 模糊隶属度
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号