摘要
本申请提供了一种视频生成方法、装置、电子设备、存储介质及程序产品,涉及计算机视觉技术领域,通过获取目标文本,目标文本用于指示视频的生成;调用已训练的目标视频生成模型基于目标文本生成目标视频,目标视频包括多帧目标视频帧,任一目标视频帧的第一区域的内容是根据目标文本生成的,任一目标视频帧的第二区域包括透明元素,这样,能够在用户输入文本后,输出第一区域有内容但第二区域包括透明元素的视频,这样不需要用户再利用一些应用程序提取视频的部分内容,从而提高用户体验。
技术关键词
视频生成模型
噪声
视频生成方法
透明度
上采样
文本特征向量
图像特征信息
视频帧
样本
机器可读存储介质
关键词
通道
计算机程序产品
元素
注意力
标记
参数
视频生成装置
系统为您推荐了相关专利信息
降噪模型
注意力
归一化模块
音频降噪方法
音频降噪系统
样本数据处理方法
强化学习算法
电力运行数据
机器学习算法
恢复电力系统
地球物理数据
反演算法
牛顿迭代法
模型更新
预测误差
水柱
匈牙利算法
轨迹
静态特征提取
卡尔曼滤波模型