一种转场视频生成方法及系统

正文

推荐专利

一种转场视频生成方法及系统

申请号：CN202411724736

申请日期：2024-11-28

公开号：CN119211642B

公开日期：2025-04-08

类型：发明专利

摘要

本申请公开了一种转场视频生成方法及系统，属于图像生成技术领域。本申请方法将首尾两帧图像分别输入变分自动编码器，以提取其潜在特征，并在正序和倒序的潜在特征之间引入预设帧数的噪声。接着，对首尾两帧图像进行描述，使用文本特征提取器提取相应的文本特征，并通过球面线性插值获得与帧数对应的图像描述特征。随后，这些描述与潜在特征共同输入预训练的文本和图像引导的视频生成扩散模型进行去噪处理。在去噪过程中，生成包含中间帧信息的噪声特征，并通过高斯过程对正序和倒序噪声特征施加时序约束。接下来，进行高低频分离与加权融合，再次进行去噪处理。最终，利用视频生成模型的解码器生成首尾两帧之间连贯流畅的转场视频。

技术关键词

视频生成方法噪声特征变分自动编码器视频生成系统高频特征文本特征向量解码器捕获特征去噪模型特征提取器视频生成模型图像生成技术交叉注意力机制视频帧线性插值方法

系统为您推荐了相关专利信息

一种特定人物的视频生成方法、装置、设备及介质

人脸面部特征生成特征视频生成方法文本多模态

基于音频驱动的人脸对话生成模型的人脸视频生成方法

注意力机制对话生成模型人脸视频生成方法音频编码器

一种基于多模态语义图的双分支扩散三维场景生成方法

场景生成方法分支三维场景建模技术文本编码器多层注意力机制

一种基于大模型的视频生成方法

视频生成方法视频生成模型视频压缩编码器生成高分辨率

一种图像生成方法、装置、电子设备及存储介质

噪声特征图像生成模型图像生成方法样本图像特征值

一种转场视频生成方法及系统

站点导航

APP 下载