摘要
本发明提出一种唇形合成模型设计方法、装置、存储介质和程序产品,涉及计算机视觉技术领域。其中,唇形合成模型设计方法包括:数据收集及预处理,获得原面部图、原情绪标签及音频特征;使用生成器获得恢复面部图及恢复情绪标签;使用判别器对原面部图与恢复面部图进行对抗训练;使用图片重建损失函数、感知损失函数、对抗损失函数、情绪损失函数进行反向迭代;针对待生成视频进行模型微调训练。本发明提高了唇形合成图像生成的整体精确性和图像质量,避免了相关生成瑕疵和错误的出现。
技术关键词
恢复面部
模型设计方法
感知损失函数
音频特征
音频编码
标签
视频
图片
计算机视觉技术
深度神经网络
情绪特征
计算机装置
计算机程序产品
处理器
解码模块
编码模块
可读存储介质
存储器
系统为您推荐了相关专利信息
命名实体识别方法
文本
权重分配策略
自然语言
跨度
音频特征
信息生成方法
卷积特征
压缩特征
卷积网络模型
音频特征
煤矸识别方法
传感器阵列
听觉
深度学习网络
生成对抗网络模型
音视频播放系统
数据
直播交互方法
生成方法