说话人脸图像生成方法、装置、设备及存储介质

AITNT
正文
推荐专利
说话人脸图像生成方法、装置、设备及存储介质
申请号:CN202411553079
申请日期:2024-10-31
公开号:CN119648821A
公开日期:2025-03-18
类型:发明专利
摘要
本发明涉及人工智能技术领域,可应用于金融科技领域,本发明公开了说话人脸图像生成方法、装置、设备及存储介质,方法包括:获取真实说话人脸图像中的真实面部关键点特征、真实头部姿态特征、真实视线方向向量和真实情感类别标签;基于预测面部关键点特征与真实面部关键点特征,确定第一损失值,基于预测头部姿态特征与真实头部姿态特征,确定第二损失值,基于预测视线方向向量与真实视线方向向量,确定第三损失值,基于预测情感类别标签与真实情感类别标签,确定第四损失值;确定训练完成的生成模型;获取训练完成的生成模型基于当前语音数据生成的当前说话人脸图像。本发明有利于提高生成的当前说话人脸图像的图像质量。
技术关键词
人脸图像生成方法 情感类别 姿态特征 关键点特征 真实面部 面部关键点 语音特征 标签 语音编码器 数据 图像生成装置 可读存储介质 人工智能技术 指令 处理器 模块 计算机设备
系统为您推荐了相关专利信息
1
虚拟试穿方法、装置、电子设备、可读存储介质及程序产品
试穿服装 人体模型 虚拟试穿方法 身材特征 视频
2
海报图像生成方法及装置
身体位置信息 对象识别 图像生成方法 图像拼接 图像生成装置
3
基于AI图像识别的新生儿面特征罕见病辅诊系统
AI图像识别 面部关键点 动态时间规整技术 面部特征 分析模块
4
基于实训视频的儿科护理实践教学VR模型生成方法和系统
模型生成方法 医疗工具 儿科 患儿 多模态
5
一种人工智能化广告发布方法
情感分析模型 广告发布方法 情感类别 更新模型参数 多层感知机
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号