摘要
本发明涉及人工智能技术领域,可应用于金融科技领域,本发明公开了说话人脸图像生成方法、装置、设备及存储介质,方法包括:获取真实说话人脸图像中的真实面部关键点特征、真实头部姿态特征、真实视线方向向量和真实情感类别标签;基于预测面部关键点特征与真实面部关键点特征,确定第一损失值,基于预测头部姿态特征与真实头部姿态特征,确定第二损失值,基于预测视线方向向量与真实视线方向向量,确定第三损失值,基于预测情感类别标签与真实情感类别标签,确定第四损失值;确定训练完成的生成模型;获取训练完成的生成模型基于当前语音数据生成的当前说话人脸图像。本发明有利于提高生成的当前说话人脸图像的图像质量。
技术关键词
人脸图像生成方法
情感类别
姿态特征
关键点特征
真实面部
面部关键点
语音特征
标签
语音编码器
数据
图像生成装置
可读存储介质
人工智能技术
指令
处理器
模块
计算机设备
系统为您推荐了相关专利信息
身体位置信息
对象识别
图像生成方法
图像拼接
图像生成装置
AI图像识别
面部关键点
动态时间规整技术
面部特征
分析模块
情感分析模型
广告发布方法
情感类别
更新模型参数
多层感知机