摘要
本申请属于人工智能领域与金融科技领域,涉及一种基于人工智能的数字人脸生成方法、装置、计算机设备及存储介质,包括:获取用户输入的目标情感标签、目标语音信息以及目标人脸图像;基于情感编码器对目标情感标签进行编码得到目标情感隐向量;基于目标流模型对目标情感隐向量进行映射处理得到目标音频情感隐向量;基于语音情感识别模型对目标语音信息进行编码得到目标音频隐向量;基于视觉编码器对目标人脸图像进行编码得到目标视觉隐向量;基于目标音频情感隐向量、目标音频隐向量以及目标视觉隐向量生成综合向量;基于数字人脸生成模型对综合向量进行处理生成目标数字人脸。通过本申请有效提高了目标数字人脸的生成效率与逼真度。
技术关键词
语音情感识别模型
人脸生成方法
数字人脸图像
计算机可读指令
生成数据集
编码器
视觉
编码模块
标签
音频特征
计算机设备
可读存储介质
网络
生成装置