摘要
本发明公开了一种基于语音驱动的AI数字人自动表情生成系统,包括语音表情生成模块、人脸表情数据库、表情特征提取模块、人脸三维重建模块;通过手动制定规则来控制语音合成参数,生成带有特定表情的语音,利用带有情感标签的大量语音数据训练模型,学习语音与情感之间的关系,并在新的文本上生成表情丰富的语音,使得数字人能够根据带有特定表情的语音在人脸表情数据库、表情特征提取模块、人脸三维重建模块的配合下驱动更加的流畅,减少了计算量了,驱动数字人表情时能够更细微地表现出来,有利于使用。
技术关键词
表情生成系统
三维人脸重建
人脸三维重建
语音
表情特征提取
人脸表情
主动外观模型
主动形状模型
特征提取单元
图像
文本信息分析
特征点
变分自动编码器
脸部特征
信号分析技术
模块
成分分析
更新模型参数
多视角
系统为您推荐了相关专利信息
自然语言识别
自然语言理解
语音交互方法
槽位识别
标记
音频控制方法
构建用户画像
多模态
噪声
车辆运行数据
机器人唤醒词
声音采集模块
信号
场景
多麦克风阵列
人流量预测方法
人流量预测系统
人脸识别摄像机
光纤交换机
应用服务器
智能调节系统
车载天窗
环境传感器单元
调节控制单元
调节天窗