摘要
本申请涉及一种视频生成方法、装置、计算机设备、存储介质和计算机程序产品。该方法包括:确定至少一个参考帧各自的参考帧特征以及初始噪声的噪声特征,并基于参考帧特征和噪声特征,按照视频帧数量构建融合特征序列;确定至少一个线稿图像帧各自的线稿帧特征,并按照至少一个线稿图像帧各自的帧序号,将至少一个线稿图像帧各自的线稿帧特征分别更新到融合特征序列中,获得更新后的融合特征序列;将更新后的融合特征序列和至少一个线稿图像帧各自的线稿帧特征进行拼接,得到扩散特征序列;基于扩散特征序列进行至少一次的逆扩散去噪处理,获得目标视频,目标视频中包括与视频帧数量相匹配的视频帧。采用本方法能够提高视频生成的处理效率。
技术关键词
融合特征
噪声特征
序列
视频生成模型
视频帧
注意力
视频生成方法
图像
噪声样本
索引
元素
计算机设备
计算机程序产品
编码特征
视频生成装置
文本
编码器
系统为您推荐了相关专利信息
预测用户意图
信息推荐系统
页面
搜索词
意图识别模型