一种多模态驱动的虚拟数字人面部动画生成方法及系统

正文

推荐专利

申请号：CN202510774722

申请日期：2025-06-11

公开号：CN120298559B

公开日期：2025-09-19

类型：发明专利

摘要

本发明公开一种多模态驱动的虚拟数字人面部动画生成方法及系统，涉及计算机图形学领域，所述方法包括：获取语音输入和文本输入并提取语音特征和文本特征，经由注意力融合模型动态融合两种特征以生成面部表情及头部姿态控制参数，并采用面部上部表情与面部下部表情差异化的驱动策略动态调节语音模态和文本模态对所述控制参数的贡献权重；基于所述控制参数对虚拟数字人面部图像进行局部变形生成初始动画帧，并利用生成对抗网络对所述初始动画进行细化处理，得到细化后的面部动画。借助上述技术方案，本发明能够生成与语音内容和文本语义相匹配且自然逼真的虚拟人面部动画。

技术关键词

语音特征文本动画生成方法生成对抗网络头部姿态控制多模态情绪特征动画生成系统融合策略人面部图像注意力机制音频特征提取长短期记忆网络计算机图形学参数特征提取单元

系统为您推荐了相关专利信息

公共政策案例分析知识图谱融合推理方法及系统

图谱推理方法三元组神经网络模型增量更新

一种基于生成对抗网络的缺陷图像生成方法、设备及介质

缺陷轮廓图像生成方法生成对抗网络图像生成网络注意力机制

一种基于多模态大模型的视觉语言交互方法及系统

语言交互方法语言交互系统多模态信息数据可视化模块

一种大语言模型注释数据集的方面情感三元组提取方法

三元组文本大语言模型解析器数据

文本生成方法、装置、计算机设备、存储介质和程序产品

文本生成模型资源文本生成方法资料标识

一种多模态驱动的虚拟数字人面部动画生成方法及系统

站点导航

APP 下载