数字人合成方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202411828251

申请日期：2024-12-12

公开号：CN119788907A

公开日期：2025-04-08

类型：发明专利

摘要

本公开提供一种数字人合成方法、装置、电子设备及存储介质，涉及人工智能技术领域。所述方法包括：获取目标图像、驱动视频及目标音频；提取所述目标图像中的三维人脸数据和三维隐式关键点，以及所述目标音频的音频特征；基于所述三维人脸数据及所述音频特征，预测所述音频特征映射的所述三维人脸数据；获取所述驱动视频中人物的头部姿态数据，并基于所述头部姿态数据、所述三维隐式关键点及所述音频特征映射的所述三维人脸数据预测所述目标图像的运动光流；基于所述运动光流合成所述数字人的视频帧图像，以得到所述数字人播报所述目标音频的视频。本公开保证了数字人的人脸细节描述及头部摆动连续自然，提高了数字人口播视频的效果及稳定性。

技术关键词

三维人脸数据音频特征人脸关键点图像视频帧运动电子设备人工智能技术计算机坐标指令矩阵模块可读存储介质处理器

系统为您推荐了相关专利信息

抗沙门氏菌纳米材料筛选系统

训练计算机筛选系统高通量筛选微流控芯片纳米材料结构

一种肉制品异物在线检测方法及系统

肉制品异物多模态传感器 X射线成像器在线检测方法视觉图像传感器

基于图文预训练模型的零样本异常检测方法、装置

异常检测方法预训练模型样本图文图像特征提取

一种铝电解残极高度测量方法、装置、设备、介质及产品

铝电解残极测量方法数据图像采集设备坐标系

基于路面识别的车辆控制方法、装置、车辆及存储介质

路面附着系数车辆控制方法识别神经网络点云训练集优化

数字人合成方法、装置、电子设备及存储介质

站点导航

APP 下载