一种唇形合成模型设计方法、装置、存储介质和程序产品

正文

推荐专利

申请号：CN202411964767

申请日期：2024-12-27

公开号：CN119888426A

公开日期：2025-04-25

类型：发明专利

摘要

本发明提出一种唇形合成模型设计方法、装置、存储介质和程序产品，涉及计算机视觉技术领域。其中，唇形合成模型设计方法包括：数据收集及预处理，获得原面部图、原情绪标签及音频特征；使用生成器获得恢复面部图及恢复情绪标签；使用判别器对原面部图与恢复面部图进行对抗训练；使用图片重建损失函数、感知损失函数、对抗损失函数、情绪损失函数进行反向迭代；针对待生成视频进行模型微调训练。本发明提高了唇形合成图像生成的整体精确性和图像质量，避免了相关生成瑕疵和错误的出现。

技术关键词

恢复面部模型设计方法感知损失函数音频特征音频编码标签视频图片计算机视觉技术深度神经网络情绪特征计算机装置计算机程序产品处理器解码模块编码模块可读存储介质存储器

系统为您推荐了相关专利信息

命名实体识别方法、装置、设备及存储介质

命名实体识别方法文本权重分配策略自然语言跨度

基于图像分析的音频信息生成方法、装置、设备及介质

音频特征信息生成方法卷积特征压缩特征卷积网络模型

直播视频剪辑方法及装置

直播视频剪辑方法节目音频特征数据标识

一种基于阵列多波束的听觉煤矸识别方法

音频特征煤矸识别方法传感器阵列听觉深度学习网络

一种数字角色音视频的生成方法、数字角色直播交互方法

生成对抗网络模型音视频播放系统数据直播交互方法生成方法

一种唇形合成模型设计方法、装置、存储介质和程序产品

站点导航

APP 下载