一种基于语音驱动的数字人唇形同步方法

AITNT
正文
推荐专利
一种基于语音驱动的数字人唇形同步方法
申请号:CN202411650725
申请日期:2024-11-19
公开号:CN119170039A
公开日期:2024-12-20
类型:发明专利
摘要
本发明提供了一种基于语音驱动的数字人唇形同步方法,包括:获取语音信号;提取语音信号中与唇形变化相关的语音特征;将提取的语音特征映射为唇形变化数据;将唇形变化数据应用到数字人模型上并进行实时渲染,完成唇形同步。本发明直接分析语音信号特征,能更准确地捕捉发音的细微变化,生成更自然流畅的唇形动作;适用于多种语言环境,特别改善了对汉语等声调语言的处理效果;优化的信号处理和映射算法提高了唇形同步的速度,满足实时交互需求;无需复杂的音素识别过程,降低了技术实现难度和维护成本;通过更精确、自然的唇形同步,显著提升了数字人的整体表现和交互自然度。
技术关键词
语音特征 同步方法 深度学习模型 信息提取方法 多尺度卷积核 语音信号特征 线性预测编码 数据 长短期记忆网络 映射算法 注意力机制 发音 模块 信号处理 轮廓 滤波 效应
系统为您推荐了相关专利信息
1
虚拟人物形象的面部与头部驱动方法、装置、设备和介质
虚拟人物形象 头部模型 面部 语音特征 隐式特征
2
一种基于深度学习算法的图像识别优化方法
深度学习算法 图像识别技术 可视化技术 深度学习模型 数据
3
一种基于深度学习的大风灾害天气指数预测系统及方法
预测持续时间 历史气象数据 预测系统 长短期记忆网络 栅格化方法
4
一种基于改进队列要素预测法的地块尺度人口预测方法
人口预测方法 数据 队列 年龄 矩阵
5
一种双模式导盲辅助方法和系统
盲道 模式识别 标志物 训练集 障碍物
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号