唇形驱动脸部生成网络训练方法、生成视频方法及装置

AITNT
正文
推荐专利
唇形驱动脸部生成网络训练方法、生成视频方法及装置
申请号:CN202411033332
申请日期:2024-07-30
公开号:CN119205997B
公开日期:2025-03-28
类型:发明专利
摘要
本发明涉及一种唇形驱动脸部生成网络训练方法、生成视频方法及装置,用于解决实时生成真实流畅的单一对象视频问题,包括:获取训练数据集,训练数据集包括完整脸部图像、遮罩脸部图像及音频语义特征;构建唇形驱动脸部生成网络,包括脸部生成器、脸部判别器和连续脸部判别器;将完整脸部图像、遮罩脸部图像及音频语义特征输入脸部生成器和脸部判别器和连续脸部判别器进行单帧训练和多帧训练,得到经训练的脸部生成器、脸部判别器和连续脸部判别器,本发明通过遮罩脸部图像生成脸部图像,具有强大的泛化能力、生成单一对象的视频真实自然流畅,通过对视频的预处理和降低生成器模型大小,减小了生成脸部图像所需的计算量,提高了生成视频的实时性。
技术关键词
感知特征 脸部关键点 网络训练方法 音频 网络训练装置 语义特征提取 生成脸部图像 样本 数据 融合算法 误差函数 对象 模块 参数 视频装置 可读存储介质
系统为您推荐了相关专利信息
1
一种语音交互方法、装置、设备及存储介质
语音识别模型 指令 语音交互方法 文本 页面
2
一种用于编码映射关系识别的起点定位方法及系统
比特流 关系 数据 定位方法 音频
3
二元自然语音作业批改方法及系统
作业批改方法 自然语音 作业批改系统 作业参数 音频特征参数
4
一种基于流水数据的画像打标方法、装置、计算机设备
流水 画像 分类场景 样式 数据
5
基于通话内容的客户意向分析方法、装置及存储介质
编码向量 编码特征 通话录音系统 分析方法 音频
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号