摘要
本发明涉及一种语音驱动三维虚拟形象表情动画生成方法,包括:输入语音片段,转换为音频特征;编码器模块对音频处理模块提取得到的音频特征、静态三维头部网格模板和输入的说话风格独热编码进行编码,将其编码到隐空间,并对其进行拼接;通过双向Mamba模块处理拼接之后的特征向量序列,对于每个位置的特征向量,捕捉上下文信息,并输出相同维度的信息交换之后的特征向量序列;解码器对经由双向Mamba模块输出的特征向量序列进行解码,得到各帧人脸面部网格的各顶点位置偏移量,将其添加到静态三维头部网格模板之上得到三维头部网格序列;使用音频‑头部网格序列数据集对整个网络模型进行端到端训练。
技术关键词
表情动画生成方法
三维虚拟形象
网格模板
音频特征
序列
编码器模块
网格编码器
音频编码器
风格
解码器
深度学习方法
压缩特征
多层感知机
语音特征
模块结构
系统为您推荐了相关专利信息
带钢表面缺陷
图像视觉特征
序列特征
数据
带钢缺陷
食管鳞癌诊断
标志物
食管鳞癌患者
核苷酸
食管鳞癌辅助诊断