一种数字人视频渲染方法、设备及介质

正文

推荐专利

一种数字人视频渲染方法、设备及介质

申请号：CN202510802605

申请日期：2025-06-16

公开号：CN120852615A

公开日期：2025-10-28

类型：发明专利

摘要

本申请公开了一种数字人视频渲染方法、设备及介质，涉及计算机图形学与生成对抗网络交叉领域，方法包括：基于单一融合架构的生成对抗网络，构建生成对抗模型；基于数字人参考图像对原始音视频数据进行多模态预处理；通过生成对抗模型的语音特征提取模块，提取双粒度语音特征，并进行融合；基于数字人参考图像对应的参考关键点和融合语音特征，在UV参数化空间中确定数字人参考图像的局部形变场；对数字人参考图像的身份纹理进行采样，生成目标数字人面部图像；通过生成对抗模型的判别器，基于多尺度对数字人面部图像进行验证。通过双粒度语音特征融合与生成器多分辨率注入，实现语音语义与面部动作的深层对齐。

技术关键词

视频渲染方法生成对抗模型人面部图像关键点语音特征提取音视频唇部特征生成对抗网络音频特征身份双粒度坐标构建三维人脸模型非易失性计算机存储介质计算机可执行指令双线性插值算法纹理

一种数字人视频渲染方法、设备及介质

站点导航

APP 下载