一种基于通用世界模型的一致性长视频生成方法

AITNT
正文
推荐专利
一种基于通用世界模型的一致性长视频生成方法
申请号:CN202510090360
申请日期:2025-01-21
公开号:CN120075547A
公开日期:2025-05-30
类型:发明专利
摘要
本申请提出一种基于通用世界模型的一致性长视频生成方法,包括:S1、接收初始输入的图像和文本描述,将其通过分词器网络进行编码为一组token,并将所述token输入多模态大模型,生成初始的状态变量;S2、利用视频扩散模型以当前状态变量为条件,生成相对应的视频片段,并对所述视频片段进行采样,提取关键帧得到观测变量;S3、将所述观测变量输入多模态大模型,结合当前状态变量,预测当前动力因素,并根据所述动力因素更新状态变量,实现状态变量的动态演化;S4、重复上述步骤S2与S3,迭代生成视频片段,最终生成具有时序一致性和内容丰富性的长视频序列。本申请通过构建通用世界模型,有效解决了长视频生成中的一致性和内容丰富性问题。
技术关键词
多模态 生成视频片段 计算机执行指令 视频生成方法 模态特征 关键帧 变量 状态更新 文本 动力 图像 视频生成装置 协同注意力 序列 可读存储介质 特征提取模块 编码 时序 处理器通信
系统为您推荐了相关专利信息
1
交通状态确定方法、装置、设备及存储介质
交通 因子 加速度 多模态 点云
2
业务流量的处理方法、装置、设备及存储介质
网络拓扑关系 计算机执行指令 蚁群算法 链路 时延
3
基于多模态数据库的索引生成方法及查询方法
多模态数据库 索引生成方法 邻居 查询方法 关系
4
一种基于AI技术的固体废物堆场远程巡航及隐患识别系统
固体废物堆场 多源监测数据 可见光图像 渗滤液 识别系统
5
基于粒子群优化的全自动粗精磨一体机磨削参数优化方法
磨削参数优化方法 粒子 图谱 编码向量 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号