一种语音驱动的动态三维人脸和动态纹理生成方法和系统

AITNT
正文
推荐专利
一种语音驱动的动态三维人脸和动态纹理生成方法和系统
申请号:CN202510201053
申请日期:2025-02-24
公开号:CN120125723A
公开日期:2025-06-10
类型:发明专利
摘要
本发明涉及三维人脸动画生成技术领域,尤其为一种语音驱动的动态三维人脸和动态纹理生成方法和系统,包括以下步骤:S1,训练两个独立的自编码器分别学习人脸几何和褶皱的变化原语,以实现将面部运动贴图和褶皱贴图压缩至低维的隐式特征;S2,基于编码器生成的隐式特征zw和zf,训练一个基于扩散模型的协同生成网络,在音频特征的引导下,从噪声输入中生成干净的隐式特征;S3,使用风格i的说话风格轴心特征pf,i来构建隐式面部运动特征,并使用风格j的褶皱风格轴心特征pw,j来构建隐式纹理变化特征。本发明可以有效解决现有的语音驱动人脸动画方法都无法同时生成与面部运动一致协调变化的动态纹理贴图,缺少这些重要的面部细节会降低人脸动画的真实感,甚至导致恐怖谷效应,影响动画效果的问题。
技术关键词
动态纹理生成方法 贴图 音频特征 风格 编码器 面部 褶皱 运动特征 大规模语音数据 动态人脸 纹理特征 人脸网格模型 噪声样本 轴心 三维人脸动画
系统为您推荐了相关专利信息
1
基于嵌入大语言模型的多模态模因有害性检测方法及装置
大语言模型 性检测方法 视觉特征 融合特征 多模态
2
基于语法和语义特征融合的蒙汉神经机器翻译方法
蒙汉神经机器翻译方法 语法特征 注意力机制 高层语义信息 解码器
3
一种基于神经网络的帧级复杂度控制方法及系统
复杂度控制方法 控制误差 编码器 序列 网络
4
鱼病检测方法、装置、设备、介质及计算机程序产品
图像 神经网络架构 计算机程序产品 编码器框架 融合特征
5
基于改善伪标签边界质量的超高分辨率遥感图像半监督变化检测方法
高分辨率遥感图像 变化检测方法 学生 变化检测网络 无标签数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号