一种基于语音驱动的AI数字人自动表情生成系统

正文

推荐专利

申请号：CN202410973676

申请日期：2024-07-19

公开号：CN118800274A

公开日期：2024-10-18

类型：发明专利

摘要

本发明公开了一种基于语音驱动的AI数字人自动表情生成系统，包括语音表情生成模块、人脸表情数据库、表情特征提取模块、人脸三维重建模块；通过手动制定规则来控制语音合成参数，生成带有特定表情的语音，利用带有情感标签的大量语音数据训练模型，学习语音与情感之间的关系，并在新的文本上生成表情丰富的语音，使得数字人能够根据带有特定表情的语音在人脸表情数据库、表情特征提取模块、人脸三维重建模块的配合下驱动更加的流畅，减少了计算量了，驱动数字人表情时能够更细微地表现出来，有利于使用。

技术关键词

表情生成系统三维人脸重建人脸三维重建语音表情特征提取人脸表情主动外观模型主动形状模型特征提取单元图像文本信息分析特征点变分自动编码器脸部特征信号分析技术模块成分分析更新模型参数多视角

系统为您推荐了相关专利信息

语音交互方法、服务器和可读存储介质

自然语言识别自然语言理解语音交互方法槽位识别标记

音频控制方法、装置、电子设备及车辆

音频控制方法构建用户画像多模态噪声车辆运行数据

一种机器人唤醒词灵敏度自适应场景噪音的方法及装置

机器人唤醒词声音采集模块信号场景多麦克风阵列

一种景区人流量预测方法、系统、介质、设备及终端

人流量预测方法人流量预测系统人脸识别摄像机光纤交换机应用服务器

一种车载天窗智能调节系统

智能调节系统车载天窗环境传感器单元调节控制单元调节天窗

一种基于语音驱动的AI数字人自动表情生成系统

站点导航

APP 下载