一种语音驱动数字人口型的方法

AITNT
正文
推荐专利
一种语音驱动数字人口型的方法
申请号:CN202510331501
申请日期:2025-03-20
公开号:CN119864040B
公开日期:2025-07-08
类型:发明专利
摘要
本申请涉及数字人领域,公开了一种语音驱动数字人口型的方法,包括以下步骤:接收语音信号并提取时频特征,基于语音信号生成个性化的声纹特征,利用非线性动力学建模生成与语音信号同步的数字人口型,并通过时序建模方法确保口型与语音信号的精准同步。进一步,通过哈密顿系统对面部表情生成进行物理约束,确保生成的面部动作符合生物力学规律。最终,根据同步结果生成数字人口型视频并输出,具有个性化、高精度同步和自然的面部表情。本发明适用于医学科普、虚拟助手等领域,能够提高视频生成效率并增强用户体验。
技术关键词
非线性动力学建模 李雅普诺夫指数 建模方法 声纹特征 面部 短时傅里叶变换 个性化语音特征 时序 时间同步 非线性动力学模型 系统状态变化 视频 语音信号处理 信号输入模块 个性化特征 特征提取模块 建模系统
系统为您推荐了相关专利信息
1
一种基于计算机视觉的吞咽训练游戏执行系统及方法
训练游戏 玩家 登录鉴权 Unity3D引擎开发 识别用户动作
2
基于人工智能优化控制的离心机动态过滤效率提升方法
人工智能优化 效率提升方法 离心机 动态 FastICA算法
3
一种三维建筑功能布局自动生成与节能优化方法
节能优化方法 建筑模型 网格模型 进化算法 布局算法
4
基于多模态数据的低氧血症风险预测系统
无痛胃肠镜检查 风险预测模型 风险预测系统 残差模块 习惯性打鼾
5
基于用户游戏表现的体感舞蹈游戏方法
舞蹈游戏 面部表情特征 动作特征 身体 面部关键点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号