一种语音驱动的动态三维人脸和动态纹理生成方法和系统

正文

推荐专利

申请号：CN202510201053

申请日期：2025-02-24

公开号：CN120125723A

公开日期：2025-06-10

类型：发明专利

摘要

本发明涉及三维人脸动画生成技术领域，尤其为一种语音驱动的动态三维人脸和动态纹理生成方法和系统，包括以下步骤：S1，训练两个独立的自编码器分别学习人脸几何和褶皱的变化原语，以实现将面部运动贴图和褶皱贴图压缩至低维的隐式特征；S2，基于编码器生成的隐式特征zw和zf，训练一个基于扩散模型的协同生成网络，在音频特征的引导下，从噪声输入中生成干净的隐式特征；S3，使用风格i的说话风格轴心特征pf,i来构建隐式面部运动特征，并使用风格j的褶皱风格轴心特征pw,j来构建隐式纹理变化特征。本发明可以有效解决现有的语音驱动人脸动画方法都无法同时生成与面部运动一致协调变化的动态纹理贴图，缺少这些重要的面部细节会降低人脸动画的真实感，甚至导致恐怖谷效应，影响动画效果的问题。

技术关键词

动态纹理生成方法贴图音频特征风格编码器面部褶皱运动特征大规模语音数据动态人脸纹理特征人脸网格模型噪声样本轴心三维人脸动画

系统为您推荐了相关专利信息

基于嵌入大语言模型的多模态模因有害性检测方法及装置

大语言模型性检测方法视觉特征融合特征多模态

基于语法和语义特征融合的蒙汉神经机器翻译方法

蒙汉神经机器翻译方法语法特征注意力机制高层语义信息解码器

一种基于神经网络的帧级复杂度控制方法及系统

复杂度控制方法控制误差编码器序列网络

鱼病检测方法、装置、设备、介质及计算机程序产品

图像神经网络架构计算机程序产品编码器框架融合特征

基于改善伪标签边界质量的超高分辨率遥感图像半监督变化检测方法

高分辨率遥感图像变化检测方法学生变化检测网络无标签数据

一种语音驱动的动态三维人脸和动态纹理生成方法和系统

站点导航

APP 下载