摘要
本发明涉及人工智能技术领域,公开了一种数字人视频生成方法、装置、设备及介质,包括:获取目标音频数据、目标数字人图像和目标情感提示信息,对目标音频数据进行特征转换,确定目标音频数据对应的视素特征,根据目标情感提示信息,匹配对应的情感特征提取技术,通过情感特征提取技术对目标情感提示信息进行特征提取,得到目标情感提示信息对应的情感特征,将视素特征和情感特征输入至已经进行面部动作预测训练好的模型中,输出面部动作系数,根据目标音频数据、目标数字人图像和面部动作系数,生成目标数字人视频。提高了生成的数字人在情感表达上的真实性和准确性。
技术关键词
特征提取技术
视频生成方法
情感特征
音频
面部
数据
视频生成技术
图像
视频生成装置
可读存储介质
文本
图片
特征提取模块
人工智能技术
处理器
计算机设备
存储器
系统为您推荐了相关专利信息
识别方法
计算机程序产品
计算机可读指令
索引
音频特征提取
K歌
矩阵
瞬态噪声
短时傅里叶变换
音频信号处理
通信节点
功能模块
数据通讯方法
蓝牙组网
通讯设备