一种语音驱动数字人口型的方法

正文

推荐专利

一种语音驱动数字人口型的方法

申请号：CN202510331501

申请日期：2025-03-20

公开号：CN119864040B

公开日期：2025-07-08

类型：发明专利

摘要

本申请涉及数字人领域，公开了一种语音驱动数字人口型的方法，包括以下步骤：接收语音信号并提取时频特征，基于语音信号生成个性化的声纹特征，利用非线性动力学建模生成与语音信号同步的数字人口型，并通过时序建模方法确保口型与语音信号的精准同步。进一步，通过哈密顿系统对面部表情生成进行物理约束，确保生成的面部动作符合生物力学规律。最终，根据同步结果生成数字人口型视频并输出，具有个性化、高精度同步和自然的面部表情。本发明适用于医学科普、虚拟助手等领域，能够提高视频生成效率并增强用户体验。

技术关键词

非线性动力学建模李雅普诺夫指数建模方法声纹特征面部短时傅里叶变换个性化语音特征时序时间同步非线性动力学模型系统状态变化视频语音信号处理信号输入模块个性化特征特征提取模块建模系统

系统为您推荐了相关专利信息

一种基于计算机视觉的吞咽训练游戏执行系统及方法

训练游戏玩家登录鉴权 Unity3D引擎开发识别用户动作

基于人工智能优化控制的离心机动态过滤效率提升方法

人工智能优化效率提升方法离心机动态 FastICA算法

一种三维建筑功能布局自动生成与节能优化方法

节能优化方法建筑模型网格模型进化算法布局算法

基于多模态数据的低氧血症风险预测系统

无痛胃肠镜检查风险预测模型风险预测系统残差模块习惯性打鼾

基于用户游戏表现的体感舞蹈游戏方法

舞蹈游戏面部表情特征动作特征身体面部关键点

一种语音驱动数字人口型的方法

站点导航

APP 下载