摘要
本公开的实施例涉及生成视频的方法、装置、设备和计算机可读存储介质。在此提出的方法包括:获取参考图像和与参考图像相关联的控制信号,控制信号包括以下中的多项:参考文本内容、参考音频内容、参考视频内容;向视频生成模型提供参考图像所对应的图像特征和与控制信号对应的控制特征,以生成目标视频,目标视频包括与参考图像中的预设对象相关联的运动内容,运动内容对应于控制信号。
技术关键词
视频生成模型
多模态注意力
图像
处理单元
音频特征
信号
通道
可读存储介质
文本
注意力机制
运动
电子设备
对象
视频帧
存储器
计算机
指令
系统为您推荐了相关专利信息
纹理特征提取
智能检测方法
图像分割算法
编码
像素点
城市管理系统
数据接口
视频处理单元
数据处理单元
距离检测