高保真高同步的说话人脸生成模型训练方法及系统

正文

推荐专利

申请号：CN202510078966

申请日期：2025-01-17

公开号：CN119963703A

公开日期：2025-05-09

类型：发明专利

摘要

本发明提供一种高保真高同步的说话人脸生成模型训练方法及系统，应用于图像处理技术领域，其中，上述方法包括：获取待驱动音频、位姿图像以及参考图像候选集；基于位姿图像与图像候选集进行难例挖掘，得到位姿图像对应的身份参考图像，其中，身份参考图像与位姿图像之间的嘴部匹配度最低；将身份参考图像、位姿图像以及待驱动音频输入至说话人脸生成模型，得到说话人脸生成模型输出的生成说话人脸图像，其中，说话人脸生成模型是基于生成对抗网络模型的；基于目标分辨率人脸图像指导的损失函数，对生成说话人脸图像模型进行监督，以训练说话人脸生成模型；通过本发明能够生成同时具有保真度和同步性的说话人脸图像。

技术关键词

生成模型训练方法生成对抗网络模型分辨率音频特征提取身份生成人脸图像图像编码器非暂态计算机可读存储介质人脸关键点检测模型训练系统矩阵处理器图像处理技术计算机程序产品

系统为您推荐了相关专利信息

一种基于近红外光谱的物质含量预测方法和计算机设备

连续小波变换深度学习模型卷积神经网络模型计算机设备样本

一种残疾人直播带货的辅助音视频生成系统及方法

生成系统标记单元 Softmax函数人脸身份语义

一种车载4D毫米波雷达稀疏天线阵列及其设计方法

稀疏天线阵列发射天线坐标方位角电平

一种轻量化空中无人机危险动作检测方法及系统

动作检测方法空中无人机检测无人机协方差矩阵记忆

服装行业全渠道自提业务的非结构化个人数据防护方法

数据防护方法数据访问权限身份生成密钥云存储服务器

高保真高同步的说话人脸生成模型训练方法及系统

站点导航

APP 下载