一种语音驱动的多表情3D面部动画生成方法及系统

正文

推荐专利

申请号：CN202411081771

申请日期：2024-08-08

公开号：CN119784902A

公开日期：2025-04-08

类型：发明专利

摘要

本发明公开了一种语音驱动的多表情3D面部动画生成方法及系统，涉及计算机动画及虚拟现实领域。获取输入的音频，将音频首先使用微调后的编码器进行编码，获得输入音频的特征；接下来使用全连接神经网络进行特征降维，以得到音频特征的潜在代码；将潜在音频代码和情绪代码以及扩散步数输进面部去噪模型中，生成潜在面部运动代码；将面部运动代码使用码本进行离散量化处理，获得码本中接近的潜在面部运动代码；将离散化后的潜在面部运动代码进行解码得到面部运动，将此面部运动与静止的面部模板相加，获得最终的完整面部运动序列。本发明生成高质量、与输入音频和情绪标签紧密同步的3D面部动画，为创建情感丰富的虚拟角色提供了新的有效手段。

技术关键词

动画生成方法面部音频特征情绪特征去噪模型运动编码模块计算机可存储介质动画生成系统语音编码解码模块标签解码器注意力信息编码编码器

系统为您推荐了相关专利信息

情绪分析方法、介质及设备

文本情绪分析方法特征提取元件数据更新情绪识别模型

业务处理方法、装置、设备和介质

客户端风险控制策略客服情感类别对象

一种人工智能面部识别装置及识别系统

人工智能面部识别装置面部识别器支撑座安装机构安装板

一种语音驱动的动态三维人脸和动态纹理生成方法和系统

动态纹理生成方法贴图音频特征风格编码器

音频处理方法、音频处理模型的训练方法、装置及设备

音频特征分类子模型网络标识融合特征

一种语音驱动的多表情3D面部动画生成方法及系统

站点导航

APP 下载