人脸视频生成方法及其模型训练方法、装置及相关设备

正文

推荐专利

申请号：CN202411550338

申请日期：2024-10-31

公开号：CN119399816A

公开日期：2025-02-07

类型：发明专利

摘要

本申请涉及人工智能技术领域，公开了一种人脸视频生成方法及其模型训练方法、装置及相关设备。该人脸视频生成模型训练方法包括：获取待处理的初始人脸图像、初始音频数据、以及情绪标签；通过预设的3D人脸重建工具处理初始人脸图像，得到第一表情特征数据；从初始音频数据提取初始音频特征数据，根据情绪标签生成对应的情绪单热特征向量；融合第一表情特征数据、初始音频特征数据和情绪单热特征向量，得到第一人脸表情系数；注入预设的噪声数据至初始人脸图像，得到第二人脸图像；输入初始人脸图像、第二人脸图像和第一人脸表情系数至预设的条件扩散模型，得到带表情的目标人脸视频，生成的人脸视频更加精准表达情绪标签所对应的面部表情。

技术关键词

视频生成模型人脸表情音频特征数据表情特征视频生成方法非易失性计算机可读存储介质图像特征数据生成器网络人脸纹理噪声数据注意力计算机可执行指令模型训练方法编码器模块深度学习模型

系统为您推荐了相关专利信息

一种动作标注数据集获取方法及装置

人体动作数据数据集获取方法视频生成模型动作捕捉设备动画

一种基于多任务协同学习的端到端人脸解析方法及系统

人脸关键点检测人脸识别数据人脸表情识别多任务解析方法

一种基于深度学习的宠物犬情绪识别方法及系统

宠物情绪识别情绪识别方法多模态特征融合特征深度学习模型训练

动作视频生成方法、相关装置和介质

噪声特征视频生成方法语义标签音频特征噪声系数

视频生成方法、装置、电子设备、介质及程序产品

音频特征视频生成方法图像计算机程序指令语义特征提取

人脸视频生成方法及其模型训练方法、装置及相关设备

站点导航

APP 下载