摘要
本公开提供了一种视频生成方法、装置、设备及存储介质,属于计算机技术领域。该方法通过视频生成模型中的多个信号处理模块分别对多种数据信号进行处理,得到多个长序列表征;通过视频生成模型中的视频扩散模型,对多个长序列表征进行处理,得到目标视频特征;对目标视频特征进行解码,得到目标视频。上述方案通过对多种数据信号的综合处理,有助于精准捕捉视频细节与特征,从而生成高质量的目标视频特征,进而得到目标视频,提升了生成的视频的质量,提高了视频生成效率。
技术关键词
视频生成模型
信号处理模块
视频生成方法
序列
相机
轨迹
融合特征
噪声信息
交叉注意力机制
多模态
视频生成装置
电子设备
可执行程序代码
图像处理
文本编码器
处理器
可读存储介质