一种语音驱动的三维虚拟形象表情动画生成方法

AITNT
正文
推荐专利
一种语音驱动的三维虚拟形象表情动画生成方法
申请号:CN202510225498
申请日期:2025-02-27
公开号:CN120163908B
公开日期:2025-11-14
类型:发明专利
摘要
本发明涉及一种语音驱动三维虚拟形象表情动画生成方法,包括:输入语音片段,转换为音频特征;编码器模块对音频处理模块提取得到的音频特征、静态三维头部网格模板和输入的说话风格独热编码进行编码,将其编码到隐空间,并对其进行拼接;通过双向Mamba模块处理拼接之后的特征向量序列,对于每个位置的特征向量,捕捉上下文信息,并输出相同维度的信息交换之后的特征向量序列;解码器对经由双向Mamba模块输出的特征向量序列进行解码,得到各帧人脸面部网格的各顶点位置偏移量,将其添加到静态三维头部网格模板之上得到三维头部网格序列;使用音频‑头部网格序列数据集对整个网络模型进行端到端训练。
技术关键词
表情动画生成方法 三维虚拟形象 网格模板 音频特征 序列 编码器模块 网格编码器 音频编码器 风格 解码器 深度学习方法 压缩特征 多层感知机 语音特征 模块结构
系统为您推荐了相关专利信息
1
基于马尔可夫重构和关联空间对齐的带钢缺陷分割方法
带钢表面缺陷 图像视觉特征 序列特征 数据 带钢缺陷
2
一种食管鳞癌诊断相关环状RNA分子标志物及其应用
食管鳞癌诊断 标志物 食管鳞癌患者 核苷酸 食管鳞癌辅助诊断
3
一种基于视频图像向量化的视频检索方法
视频检索方法 关键帧 视频库 样本 图像
4
一种多相位时钟的数字校准方法及系统
数字校准方法 时钟 数字逻辑电路 偏差 曲线
5
一种抗菌肽、组合物及应用
抗菌肽 苏氨酸 药物组合物 多粘菌素 二氨基
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号