一种多模态驱动的虚拟数字人面部动画生成方法及系统

AITNT
正文
推荐专利
一种多模态驱动的虚拟数字人面部动画生成方法及系统
申请号:CN202510774722
申请日期:2025-06-11
公开号:CN120298559B
公开日期:2025-09-19
类型:发明专利
摘要
本发明公开一种多模态驱动的虚拟数字人面部动画生成方法及系统,涉及计算机图形学领域,所述方法包括:获取语音输入和文本输入并提取语音特征和文本特征,经由注意力融合模型动态融合两种特征以生成面部表情及头部姿态控制参数,并采用面部上部表情与面部下部表情差异化的驱动策略动态调节语音模态和文本模态对所述控制参数的贡献权重;基于所述控制参数对虚拟数字人面部图像进行局部变形生成初始动画帧,并利用生成对抗网络对所述初始动画进行细化处理,得到细化后的面部动画。借助上述技术方案,本发明能够生成与语音内容和文本语义相匹配且自然逼真的虚拟人面部动画。
技术关键词
语音特征 文本 动画生成方法 生成对抗网络 头部姿态控制 多模态 情绪特征 动画生成系统 融合策略 人面部图像 注意力机制 音频特征提取 长短期记忆网络 计算机图形学 参数 特征提取单元
系统为您推荐了相关专利信息
1
公共政策案例分析知识图谱融合推理方法及系统
图谱 推理方法 三元组 神经网络模型 增量更新
2
一种基于生成对抗网络的缺陷图像生成方法、设备及介质
缺陷轮廓 图像生成方法 生成对抗网络 图像生成网络 注意力机制
3
一种基于多模态大模型的视觉语言交互方法及系统
语言交互方法 语言交互系统 多模态信息 数据 可视化模块
4
一种大语言模型注释数据集的方面情感三元组提取方法
三元组 文本 大语言模型 解析器 数据
5
文本生成方法、装置、计算机设备、存储介质和程序产品
文本生成模型 资源 文本生成方法 资料 标识
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号