数字人视频生成方法、装置、设备及介质

正文

推荐专利

数字人视频生成方法、装置、设备及介质

申请号：CN202411535133

申请日期：2024-10-30

公开号：CN119484950A

公开日期：2025-02-18

类型：发明专利

摘要

本发明涉及人工智能技术领域，公开了一种数字人视频生成方法、装置、设备及介质，包括：获取目标音频数据、目标数字人图像和目标情感提示信息，对目标音频数据进行特征转换，确定目标音频数据对应的视素特征，根据目标情感提示信息，匹配对应的情感特征提取技术，通过情感特征提取技术对目标情感提示信息进行特征提取，得到目标情感提示信息对应的情感特征，将视素特征和情感特征输入至已经进行面部动作预测训练好的模型中，输出面部动作系数，根据目标音频数据、目标数字人图像和面部动作系数，生成目标数字人视频。提高了生成的数字人在情感表达上的真实性和准确性。

技术关键词

特征提取技术视频生成方法情感特征音频面部数据视频生成技术图像视频生成装置可读存储介质文本图片特征提取模块人工智能技术处理器计算机设备存储器

系统为您推荐了相关专利信息

翻唱歌曲识别方法、装置、电子设备与计算机程序产品

识别方法计算机程序产品计算机可读指令索引音频特征提取

一种基于人声分离与修复的K歌音频处理方法

K歌矩阵瞬态噪声短时傅里叶变换音频信号处理

文本转语音方法、装置、计算机设备、可读存储介质和程序产品

语义置信度阈值文本转语音方法音频解码器

基于多智能体的心理测评方法、装置及系统

游戏图像心理测评方法文本框架大语言模型

基于蓝牙组网的数据通讯方法、系统、装置及存储介质

通信节点功能模块数据通讯方法蓝牙组网通讯设备

数字人视频生成方法、装置、设备及介质

站点导航

APP 下载