一种基于语音驱动的数字人唇形同步方法

正文

推荐专利

一种基于语音驱动的数字人唇形同步方法

申请号：CN202411650725

申请日期：2024-11-19

公开号：CN119170039A

公开日期：2024-12-20

类型：发明专利

摘要

本发明提供了一种基于语音驱动的数字人唇形同步方法，包括：获取语音信号；提取语音信号中与唇形变化相关的语音特征；将提取的语音特征映射为唇形变化数据；将唇形变化数据应用到数字人模型上并进行实时渲染，完成唇形同步。本发明直接分析语音信号特征，能更准确地捕捉发音的细微变化，生成更自然流畅的唇形动作；适用于多种语言环境，特别改善了对汉语等声调语言的处理效果；优化的信号处理和映射算法提高了唇形同步的速度，满足实时交互需求；无需复杂的音素识别过程，降低了技术实现难度和维护成本；通过更精确、自然的唇形同步，显著提升了数字人的整体表现和交互自然度。

技术关键词

语音特征同步方法深度学习模型信息提取方法多尺度卷积核语音信号特征线性预测编码数据长短期记忆网络映射算法注意力机制发音模块信号处理轮廓滤波效应

系统为您推荐了相关专利信息

虚拟人物形象的面部与头部驱动方法、装置、设备和介质

虚拟人物形象头部模型面部语音特征隐式特征

一种基于深度学习算法的图像识别优化方法

深度学习算法图像识别技术可视化技术深度学习模型数据

一种基于深度学习的大风灾害天气指数预测系统及方法

预测持续时间历史气象数据预测系统长短期记忆网络栅格化方法

一种基于改进队列要素预测法的地块尺度人口预测方法

人口预测方法数据队列年龄矩阵

一种双模式导盲辅助方法和系统

盲道模式识别标志物训练集障碍物

一种基于语音驱动的数字人唇形同步方法

站点导航

APP 下载