一种基于低计算量语音驱动的实时数字人生成系统及方法

正文

推荐专利

申请号：CN202510432794

申请日期：2025-04-08

公开号：CN119991893B

公开日期：2025-06-17

类型：发明专利

摘要

本发明公开一种基于低计算量语音驱动的实时数字人生成系统及方法，涉及数字人交互技术领域，所述系统包括：音频处理模块，配置为实时接收语音输入并提取音频特征向量；驱动与渲染模块，用于将音频特征向量映射为表征嘴部运动的参数，基于预处理的静态人脸参考数据及所述参数生成动态嘴部图像，并与参考图像融合；同步控制模块，用于根据时间戳对齐机制与PID反馈控制算法确保音频特征与渲染视频帧的同步；动态调度模块，用于实时监控硬件资源负载，并通过多线程并行及任务优先级调整实现计算资源的动态分配。根据本申请的技术方案，能够在移动端、嵌入式及多平台场景下实现数字人低延迟、高保真、低耗能的突破。

技术关键词

同步控制模块生成系统参数动态估计背景噪声轻量级算法音频特征提取网格语音图像人脸多线程掩膜矩阵 PID算法可读存储介质网络抖动插值模块

系统为您推荐了相关专利信息

语种分类模型训练方法、语种识别方法、装置及智能设备

分类模型训练方法声学特征融合特征语种识别方法编码特征

多源数据融合的网络安全态势感知方法、装置、设备及介质

异常信号有向图模型支持向量机分类器滑动时间窗口网络套接字

停车场巡检机器人用路径规划方法和系统

停车场巡检机器人机器人巡检路径规划方法指标路径规划系统

一种桥梁钢阻尼器的参数配置方法、系统、设备及介质

钢阻尼器参数配置方法三维模型阻尼单元有限元分析模型

基于能量函数的多虚拟同步机并网系统暂态稳定评估方法

虚拟同步机并网系统故障切除时刻稳定性评估方法保证系统

一种基于低计算量语音驱动的实时数字人生成系统及方法

站点导航

APP 下载