一种唇形合成模型设计方法、装置、存储介质和程序产品

AITNT
正文
推荐专利
一种唇形合成模型设计方法、装置、存储介质和程序产品
申请号:CN202411964767
申请日期:2024-12-27
公开号:CN119888426A
公开日期:2025-04-25
类型:发明专利
摘要
本发明提出一种唇形合成模型设计方法、装置、存储介质和程序产品,涉及计算机视觉技术领域。其中,唇形合成模型设计方法包括:数据收集及预处理,获得原面部图、原情绪标签及音频特征;使用生成器获得恢复面部图及恢复情绪标签;使用判别器对原面部图与恢复面部图进行对抗训练;使用图片重建损失函数、感知损失函数、对抗损失函数、情绪损失函数进行反向迭代;针对待生成视频进行模型微调训练。本发明提高了唇形合成图像生成的整体精确性和图像质量,避免了相关生成瑕疵和错误的出现。
技术关键词
恢复面部 模型设计方法 感知损失函数 音频特征 音频编码 标签 视频 图片 计算机视觉技术 深度神经网络 情绪特征 计算机装置 计算机程序产品 处理器 解码模块 编码模块 可读存储介质 存储器
系统为您推荐了相关专利信息
1
命名实体识别方法、装置、设备及存储介质
命名实体识别方法 文本 权重分配策略 自然语言 跨度
2
基于图像分析的音频信息生成方法、装置、设备及介质
音频特征 信息生成方法 卷积特征 压缩特征 卷积网络模型
3
直播视频剪辑方法及装置
直播视频剪辑方法 节目 音频特征 数据 标识
4
一种基于阵列多波束的听觉煤矸识别方法
音频特征 煤矸识别方法 传感器阵列 听觉 深度学习网络
5
一种数字角色音视频的生成方法、数字角色直播交互方法
生成对抗网络模型 音视频播放系统 数据 直播交互方法 生成方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号