摘要
本申请实施例提供了一种视频生成方法、装置、电子设备及可读存储介质,所述方法包括:通过人脸检测算法,从待融合的原始图像中提取出包含人脸区域的第一图像;根据参考视频中每帧图像的人物头部姿态,对第一图像中人物头部姿态进行调整,生成第二图像;根据参考音频的时长和第二图像,生成第三图像;根据参考音频对应的音频特征,调整每个第三图像中的人物口型,生成第四图像;根据目标算法,分别确定每个第四图像和第一图像之间的第一光流变换矩阵;根据每个第四图像对应的第一光流变换矩阵,对原始图像的背景进行光流驱动,生成第五图像;针对每个第四图像,对第四图像和第五图像进行融合,生成目标视频,提高视频的生动性。
技术关键词
图像
音频特征
视频生成方法
人脸检测算法
矩阵
视频生成装置
电子设备
通信接口
可读存储介质
特征提取模块
序列
处理器
元素
存储器
指令
掩膜