唇形驱动脸部生成网络训练方法、生成视频方法及装置

正文

推荐专利

申请号：CN202411033332

申请日期：2024-07-30

公开号：CN119205997B

公开日期：2025-03-28

类型：发明专利

摘要

本发明涉及一种唇形驱动脸部生成网络训练方法、生成视频方法及装置，用于解决实时生成真实流畅的单一对象视频问题，包括：获取训练数据集，训练数据集包括完整脸部图像、遮罩脸部图像及音频语义特征；构建唇形驱动脸部生成网络，包括脸部生成器、脸部判别器和连续脸部判别器；将完整脸部图像、遮罩脸部图像及音频语义特征输入脸部生成器和脸部判别器和连续脸部判别器进行单帧训练和多帧训练，得到经训练的脸部生成器、脸部判别器和连续脸部判别器，本发明通过遮罩脸部图像生成脸部图像，具有强大的泛化能力、生成单一对象的视频真实自然流畅，通过对视频的预处理和降低生成器模型大小，减小了生成脸部图像所需的计算量，提高了生成视频的实时性。

技术关键词

感知特征脸部关键点网络训练方法音频网络训练装置语义特征提取生成脸部图像样本数据融合算法误差函数对象模块参数视频装置可读存储介质

系统为您推荐了相关专利信息

一种语音交互方法、装置、设备及存储介质

语音识别模型指令语音交互方法文本页面

一种用于编码映射关系识别的起点定位方法及系统

比特流关系数据定位方法音频

二元自然语音作业批改方法及系统

作业批改方法自然语音作业批改系统作业参数音频特征参数

一种基于流水数据的画像打标方法、装置、计算机设备

流水画像分类场景样式数据

基于通话内容的客户意向分析方法、装置及存储介质

编码向量编码特征通话录音系统分析方法音频

唇形驱动脸部生成网络训练方法、生成视频方法及装置

站点导航

APP 下载