高保真高同步的说话人脸生成模型训练方法及系统

AITNT
正文
推荐专利
高保真高同步的说话人脸生成模型训练方法及系统
申请号:CN202510078966
申请日期:2025-01-17
公开号:CN119963703A
公开日期:2025-05-09
类型:发明专利
摘要
本发明提供一种高保真高同步的说话人脸生成模型训练方法及系统,应用于图像处理技术领域,其中,上述方法包括:获取待驱动音频、位姿图像以及参考图像候选集;基于位姿图像与图像候选集进行难例挖掘,得到位姿图像对应的身份参考图像,其中,身份参考图像与位姿图像之间的嘴部匹配度最低;将身份参考图像、位姿图像以及待驱动音频输入至说话人脸生成模型,得到说话人脸生成模型输出的生成说话人脸图像,其中,说话人脸生成模型是基于生成对抗网络模型的;基于目标分辨率人脸图像指导的损失函数,对生成说话人脸图像模型进行监督,以训练说话人脸生成模型;通过本发明能够生成同时具有保真度和同步性的说话人脸图像。
技术关键词
生成模型训练方法 生成对抗网络模型 分辨率 音频特征提取 身份 生成人脸图像 图像编码器 非暂态计算机可读存储介质 人脸关键点检测 模型训练系统 矩阵 处理器 图像处理技术 计算机程序产品
系统为您推荐了相关专利信息
1
一种基于近红外光谱的物质含量预测方法和计算机设备
连续小波变换 深度学习模型 卷积神经网络模型 计算机设备 样本
2
一种残疾人直播带货的辅助音视频生成系统及方法
生成系统 标记单元 Softmax函数 人脸身份 语义
3
一种车载4D毫米波雷达稀疏天线阵列及其设计方法
稀疏天线阵列 发射天线 坐标 方位角 电平
4
一种轻量化空中无人机危险动作检测方法及系统
动作检测方法 空中无人机 检测无人机 协方差矩阵 记忆
5
服装行业全渠道自提业务的非结构化个人数据防护方法
数据防护方法 数据访问权限 身份 生成密钥 云存储服务器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号