摘要
本发明实施例公开了一种图生视频方法和装置。本发明实施例将包含目标对象的源图像输入第一视频生成模型得到素材视频,根据素材视频确定帧间变换矩阵序列,然后从源图像中得到目标对象对应的对象掩码图像,将帧间变换矩阵序列应用于对象掩码图像可得到多张掩码图像从而组成掩码图像序列,将帧间变换矩阵序列应用于源图像可得到多张目标对象图像从而组成目标对象图像序列,根据源图像、掩码图像序列和目标对象图像序列确定目标输入数据,将目标输入数据输入支持局部重绘的第二视频生成模型,得到对应的目标视频。通过两次模型生成视频,实现了智能化端到端的图生视频,无需引入预设运动参数即可在保持目标对象不扩散的同时,实现运动轨迹多样性。
技术关键词
视频生成模型
序列
对象
矩阵
视频帧
计算机程序指令
运动
数据
输入模块
可读存储介质
视频装置
计算机程序产品
处理器
图像分割
存储器
电子设备
系统为您推荐了相关专利信息
建模系统
时间序列数据库
卡尔曼滤波器
数据采集系统
数字孪生模型
混合效应模型
一元线性回归模型
区域作物
时序
混合线性模型
融合图像特征
多模态
特征提取模块
矩阵
解码模块
地质勘测方法
动态规划算法
贝叶斯网络模型
资源调度优化
粒子群算法