一种语音驱动的三维虚拟形象表情动画生成方法

正文

推荐专利

申请号：CN202510225498

申请日期：2025-02-27

公开号：CN120163908B

公开日期：2025-11-14

类型：发明专利

摘要

本发明涉及一种语音驱动三维虚拟形象表情动画生成方法，包括：输入语音片段，转换为音频特征；编码器模块对音频处理模块提取得到的音频特征、静态三维头部网格模板和输入的说话风格独热编码进行编码，将其编码到隐空间，并对其进行拼接；通过双向Mamba模块处理拼接之后的特征向量序列，对于每个位置的特征向量，捕捉上下文信息，并输出相同维度的信息交换之后的特征向量序列；解码器对经由双向Mamba模块输出的特征向量序列进行解码，得到各帧人脸面部网格的各顶点位置偏移量，将其添加到静态三维头部网格模板之上得到三维头部网格序列；使用音频‑头部网格序列数据集对整个网络模型进行端到端训练。

技术关键词

表情动画生成方法三维虚拟形象网格模板音频特征序列编码器模块网格编码器音频编码器风格解码器深度学习方法压缩特征多层感知机语音特征模块结构

系统为您推荐了相关专利信息

基于马尔可夫重构和关联空间对齐的带钢缺陷分割方法

带钢表面缺陷图像视觉特征序列特征数据带钢缺陷

一种食管鳞癌诊断相关环状RNA分子标志物及其应用

食管鳞癌诊断标志物食管鳞癌患者核苷酸食管鳞癌辅助诊断

一种基于视频图像向量化的视频检索方法

视频检索方法关键帧视频库样本图像

一种多相位时钟的数字校准方法及系统

数字校准方法时钟数字逻辑电路偏差曲线

一种抗菌肽、组合物及应用

抗菌肽苏氨酸药物组合物多粘菌素二氨基

一种语音驱动的三维虚拟形象表情动画生成方法

站点导航

APP 下载