数字人音视频生成方法、系统、设备及介质

正文

推荐专利

数字人音视频生成方法、系统、设备及介质

申请号：CN202411970983

申请日期：2024-12-30

公开号：CN119785820A

公开日期：2025-04-08

类型：发明专利

摘要

本申请提供的一种数字人音视频生成方法、系统、设备及介质，所述方法包括：首先，获取文本信息和初始图像；基于情绪分析模型确定文本信息对应的情绪类别；识别初始图像中的人脸区域，得到初始图像中数字人对应的性别类别；基于情绪类别与性别类别生成数字人对应的音频数据；基于音频数据与初始图像生成数字人初始视频；将数字人初始视频输入唇形对齐模型中获得输出视频；输出视频中数字人的嘴型与音频数据对齐。利用情绪分析模型和图像识别技术，能够准确识别文本信息的情绪类别和初始图像中数字人的性别类别，生成具有情绪表达的数字人视频。

技术关键词

音视频生成方法高维特征向量生成数字人人脸情感分析模型音频动作融合文本识别模块面部识别数据图像分割算法图像识别技术处理器深度学习模型关键词

系统为您推荐了相关专利信息

人脸识别特征的降维方法及装置

特征提取模型人脸识别特征矩阵识别人脸图像对象

基于多粒度特征融合的换脸检测方法、装置及设备

多粒度特征分支可视化检测系统换脸视频注意力机制

一种人脸识别方法、装置、设备及介质

图像特征值视角分类器人脸识别方法数据

基于输入数据保护的模型交互方法、输入数据保护方法

大语言模型交互方法加密策略文本数据保护方法

一种门禁安防装置

门禁安防装置人脸识别装置闸机往复丝杆固定架

数字人音视频生成方法、系统、设备及介质

站点导航

APP 下载