摘要
一种视频生成方法、装置、介质、设备及计算机程序产品,所述方法包括:获取控制图像和所述控制图像对应的深度图,以及用于视频生成的目标相机轨迹信息;根据所述控制图像、所述深度图、所述目标相机轨迹信息和视频生成模型,对噪声图像特征进行去噪处理,确定所述控制图像对应的目标视频和所述目标视频对应的目标视频深度信息。由此,在通过图像进行视频生成的过程中,可以结合相机轨迹信息和控制图像的深度信息进行视频生成,从而获得在相机轨迹信息控制下的目标视频及其视频深度信息,基于目标视频和视频深度信息可以直接渲染获得3D场景,则可以提高目标视频和相机轨迹信息之间的匹配度,无需复杂的流程和额外操作便可快速获取3D场景。
技术关键词
视频生成模型
深度编码
编码特征
深度图
视频编码
图像编码
轨迹
相机
噪声图像
视频生成方法
输出特征
计算机程序产品
编码器
分块特征
投影特征
训练样本集
注意力
系统为您推荐了相关专利信息
煤堆表面
露天煤矿挖掘机
自动控制系统
编码向量
编码特征
音频生成方法
多模态
音频编码器
音频解码器
文本编码器
深度图超分辨率
高分辨率深度图
特征提取模块
重构方法
重构模型
通话信息处理方法
网络环境感知
转移概率矩阵
实时视频
视频编码
语义理解系统
嵌入特征
视频特征提取
文本
子模块