基于人工智能的数字人视频生成方法、装置、设备及介质

正文

推荐专利

申请号：CN202411115975

申请日期：2024-08-14

公开号：CN119211455A

公开日期：2024-12-27

类型：发明专利

摘要

本申请属于人工智能领域与金融科技领域，涉及一种基于人工智能的数字人视频生成方法、装置、计算机设备及存储介质，包括：获取用户输入的人脸图像与话术文本；基于分层表示模型对人脸图像进行三维人脸重建得到三维人脸模型；从三维人脸模型中提取三维人脸模型参数；基于用户触发的对于三维人脸模型参数的调整处理得到目标三维人脸模型参数；基于语音合成组件对话术文本进行语音生成处理得到目标语音；基于合成模型对目标三维人脸模型参数与目标语音进行数字人视频合成得到目标数字人视频；将目标数字人视频返回给用户。此外，目标数字人视频可存储于区块链中。本申请基于分层表示模型与合成模型的使用，有效提高了生成的数字人视频的真实感。

技术关键词

三维人脸模型视频生成方法三维人脸重建语音计算机可读指令参数文本分层图像面部特征感知损失函数视频生成装置计算机设备模块可读存储介质策略界面生成算法

系统为您推荐了相关专利信息

基于虚拟现实与智能分析的水电站应急演练系统及方法

应急演练系统 VR眼镜水电站控制终端现场画面

一种基于多视图的驾驶员异常行为检测系统及方法

可视化界面多尺度特征图像组合全局平均池化注意力机制

一种基于AI的穿戴设备情绪健康监控系统及操作方法

虚拟现实头戴式设备图像数据采集模块健康监控系统穿戴设备触觉反馈模块

视频生成方法、装置、设备、系统及计算机程序产品

大语言模型视频生成模型噪声预测多模态视频帧特征

一种基于多维信息感知策略的语音情感识别方法和系统

语音情感识别方法 MFCC特征融合特征语音情感识别系统语音情感识别技术

基于人工智能的数字人视频生成方法、装置、设备及介质

站点导航

APP 下载