摘要
本公开关于一种视频生成方法、装置、电子设备及存储介质。所述方法包括:获取视频生成请求,所述视频生成请求包含用户输入的多模态数据;基于所述多模态数据,确定所述视频生成请求对应的视频生成任务的任务信息、以及所述视频生成任务的视觉描述信息;基于所述多模态数据生成上下文条件控制序列,并基于所述上下文条件控制序列生成内容特征序列;将所述任务信息、所述视觉描述信息、所述内容特征序列输入视频生成模型,生成目标视频。采用本公开可以提升视频生成的质量。
技术关键词
视频生成模型
视频生成方法
序列
多模态
数据
视觉
噪声特征
基底
电子设备
视频生成装置
意图识别模型
时序
可读存储介质
处理器
注意力
编码
索引
指令
计算机