说话人脸图像生成方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202411553079

申请日期：2024-10-31

公开号：CN119648821A

公开日期：2025-03-18

类型：发明专利

摘要

本发明涉及人工智能技术领域，可应用于金融科技领域，本发明公开了说话人脸图像生成方法、装置、设备及存储介质，方法包括：获取真实说话人脸图像中的真实面部关键点特征、真实头部姿态特征、真实视线方向向量和真实情感类别标签；基于预测面部关键点特征与真实面部关键点特征，确定第一损失值，基于预测头部姿态特征与真实头部姿态特征，确定第二损失值，基于预测视线方向向量与真实视线方向向量，确定第三损失值，基于预测情感类别标签与真实情感类别标签，确定第四损失值；确定训练完成的生成模型；获取训练完成的生成模型基于当前语音数据生成的当前说话人脸图像。本发明有利于提高生成的当前说话人脸图像的图像质量。

技术关键词

人脸图像生成方法情感类别姿态特征关键点特征真实面部面部关键点语音特征标签语音编码器数据图像生成装置可读存储介质人工智能技术指令处理器模块计算机设备

系统为您推荐了相关专利信息

虚拟试穿方法、装置、电子设备、可读存储介质及程序产品

试穿服装人体模型虚拟试穿方法身材特征视频

海报图像生成方法及装置

身体位置信息对象识别图像生成方法图像拼接图像生成装置

基于AI图像识别的新生儿面特征罕见病辅诊系统

AI图像识别面部关键点动态时间规整技术面部特征分析模块

基于实训视频的儿科护理实践教学VR模型生成方法和系统

模型生成方法医疗工具儿科患儿多模态

一种人工智能化广告发布方法

情感分析模型广告发布方法情感类别更新模型参数多层感知机

说话人脸图像生成方法、装置、设备及存储介质

站点导航

APP 下载