摘要
本发明涉及一种唇形驱动脸部生成网络训练方法、生成视频方法及装置,用于解决实时生成真实流畅的单一对象视频问题,包括:获取训练数据集,训练数据集包括完整脸部图像、遮罩脸部图像及音频语义特征;构建唇形驱动脸部生成网络,包括脸部生成器、脸部判别器和连续脸部判别器;将完整脸部图像、遮罩脸部图像及音频语义特征输入脸部生成器和脸部判别器和连续脸部判别器进行单帧训练和多帧训练,得到经训练的脸部生成器、脸部判别器和连续脸部判别器,本发明通过遮罩脸部图像生成脸部图像,具有强大的泛化能力、生成单一对象的视频真实自然流畅,通过对视频的预处理和降低生成器模型大小,减小了生成脸部图像所需的计算量,提高了生成视频的实时性。
技术关键词
感知特征
脸部关键点
网络训练方法
音频
网络训练装置
语义特征提取
生成脸部图像
样本
数据
融合算法
误差函数
对象
模块
参数
视频装置
可读存储介质
系统为您推荐了相关专利信息
作业批改方法
自然语音
作业批改系统
作业参数
音频特征参数