数字人视频生成方法、设备、介质及程序产品

正文

推荐专利

申请号：CN202411622831

申请日期：2024-11-14

公开号：CN119520924A

公开日期：2025-02-25

类型：发明专利

摘要

本发明公开了一种数字人视频生成方法、设备、介质及程序产品，方法包括：首先对数字人视频素材进行数据预处理，得到预处理后的数字人序列帧图像；再对预处理后的数字人序列帧图像进行面部识别处理，得到面部序列帧图像；将文本输入转换为语音音频，将面部序列帧图像和语音音频输入至唇形同步模型，生成与语音音频精确对齐的唇部运动的第一序列帧同步图像；利用面部修复模型对第一序列帧同步图像进行面部高清修复处理，得到第二序列帧同步图像；最后利用第二序列帧同步图像和语音音频进行视频合成处理，得到数字人视频。本发明实现了支持多语言的自动化、集成化数字人视频生成，有效提高了生成效率，生成的数字人视频具有高度真实感和流畅度。

技术关键词

序列帧视频生成方法图像语音音频计算机程序指令视频生成设备面部识别模型挂件计算机程序产品 GPU服务器 HLS协议多语言文本可读存储介质音视频数据

系统为您推荐了相关专利信息

视频内容修改方法、装置、电子设备及存储介质

音频修改方法人声文本动作特征

基于能量函数的全局最优化缺陷骨架提取系统及方法

生成树分支全局最优化模块节点

一种基于InVEST模型的区域产水量计算方法

序列计算方法像素点图像分割原始地层压力

一种织袜机的花型文件生成方法、系统及介质

织袜机花型文件图像参数优化模型生成方法

一种用于分割任意区域的高效分割方法、装置及设备

骨骼CT图像级联神经网络分割方法计算机程序指令尺寸

数字人视频生成方法、设备、介质及程序产品

站点导航

APP 下载