摘要
本申请涉及人工智能技术领域,提供了一种视频生成方法、装置、电子设备及可读存储介质。该方法包括:获取外观参考视频和运动参考视频;将外观参考视频、运动参考视频以及噪声图输入至训练好的视频生成模型中,得到视频生成模型输出的目标视频;其中,视频生成模型包括运动处理分支、外观处理分支以及扩散模块,运动处理分支用于提取运动参考视频的运动特征,外观处理分支用于提取外观参考视频的外观特征,扩散模块用于将运动特征、外观特征以及噪声图进行融合,并生成目标视频。本申请可以在精确控制物体的运动信息的同时,保持物体外观与背景的完整性,使得物体外观与背景不随运动信息的改变而发生改变,从而提高生成视频的质量。
技术关键词
视频生成模型
运动特征
注意力
样本
文本
分支
适配器
子模块
视频生成方法
噪声
深度图
视频帧
视频生成装置
电子设备
可读存储介质
人工智能技术
处理器
系统为您推荐了相关专利信息
重排特征
融合特征
表面缺陷检测方法
多层次特征
表面缺陷检测装置
表情识别方法
多尺度特征
面部图像数据
神经网络模型
注意力机制
图像风格迁移方法
多层感知器
像素点
特征提取模块
图像特征提取模型
学习分类方法
样本
深度神经网络训练
多智能体强化学习
多智能体协作
自动筛选方法
神经网络模型
语义关系识别模型
文本
自动筛选装置