一种语音驱动的多表情3D面部动画生成方法及系统

AITNT
正文
推荐专利
一种语音驱动的多表情3D面部动画生成方法及系统
申请号:CN202411081771
申请日期:2024-08-08
公开号:CN119784902A
公开日期:2025-04-08
类型:发明专利
摘要
本发明公开了一种语音驱动的多表情3D面部动画生成方法及系统,涉及计算机动画及虚拟现实领域。获取输入的音频,将音频首先使用微调后的编码器进行编码,获得输入音频的特征;接下来使用全连接神经网络进行特征降维,以得到音频特征的潜在代码;将潜在音频代码和情绪代码以及扩散步数输进面部去噪模型中,生成潜在面部运动代码;将面部运动代码使用码本进行离散量化处理,获得码本中接近的潜在面部运动代码;将离散化后的潜在面部运动代码进行解码得到面部运动,将此面部运动与静止的面部模板相加,获得最终的完整面部运动序列。本发明生成高质量、与输入音频和情绪标签紧密同步的3D面部动画,为创建情感丰富的虚拟角色提供了新的有效手段。
技术关键词
动画生成方法 面部 音频特征 情绪特征 去噪模型 运动 编码模块 计算机可存储介质 动画生成系统 语音编码 解码模块 标签 解码器 注意力 信息编码 编码器
系统为您推荐了相关专利信息
1
情绪分析方法、介质及设备
文本 情绪分析方法 特征提取元件 数据更新 情绪识别模型
2
业务处理方法、装置、设备和介质
客户端 风险控制策略 客服 情感类别 对象
3
一种人工智能面部识别装置及识别系统
人工智能面部识别装置 面部识别器 支撑座 安装机构 安装板
4
一种语音驱动的动态三维人脸和动态纹理生成方法和系统
动态纹理生成方法 贴图 音频特征 风格 编码器
5
音频处理方法、音频处理模型的训练方法、装置及设备
音频特征 分类子模型 网络 标识 融合特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号