摘要
本申请公开了一种数字人生成方法、装置、设备及存储介质,涉及数字人技术领域,包括:获取数字人音频,将数字人音频输入至预设Audio2Face模型中,得到预设Audio2Face模型输出的表情系数和头部姿态,Audio2Face模型用于根据输入的音频文件生成对应的表情系数和头部姿态;根据表情系数和头部姿态确定目标图像的颜色和透明度;基于目标图像的颜色和透明度渲染出目标图像,并根据渲染出的目标图像生成数字人。相对于现有的通过三维建模软件手工创建数字人模型的方式,本申请能够生成实时性高,人物画面质量高、表情丰富的数字人。
技术关键词
音频特征
透明度
生成方法
生成数字人
图像
颜色
生成装置
三维建模软件
样本
数据
分割算法
生成设备
参数
处理器
模块
可读存储介质
网络
存储器
系统为您推荐了相关专利信息
三维医学图像配准
空间变换网络
特征提取模块
编码器
语义特征
纹理
反射率数据
物理
多尺度感知网络
模型训练模块
稠密深度图
通道注意力机制
深度补全方法
融合特征
激光雷达点云数据
铝合金结构
生成式对抗神经网络
三维表征方法
裂纹检测装置
激励线圈组