一种用于混合语音分离、降噪及声音识别的语音处理方法及系统

正文

推荐专利

申请号：CN202510543872

申请日期：2025-04-28

公开号：CN120581016A

公开日期：2025-09-02

类型：发明专利

摘要

发明名称：一种用于混合语音分离、降噪及声音识别的语音处理方法及系统摘要：本发明公开了一种用于混合语音分离、降噪及声音识别的语音处理方法及系统，涉及语音处理技术领域，主要组成部分由主要由声纹数据库构建、混合语音分离、自适应噪声抑制及语音识别模块组成，采用CNN‑RNN模型提取声纹特征；通过基于编码器－解码器结构的深度学习模型及注意力机制分离混合语音；采用基于最小统计量的噪声估计算法与多模态降噪方法抑制噪声；对降噪语音提取MFCC、LPCC及深度特征并融合，经自编码器优化后，用改进的支持向量机（SVM）或深度神经网络分类器识别。本发明解决了现有技术在混合语音分离、降噪、声纹识别及处理效率方面的不足，能精确分离已知声纹语音，有效降噪并实现高精度声音识别，满足实时处理需求。

技术关键词

深度神经网络分类器噪声抑制模块语音识别模块声纹特征支持向量机编码器深度学习降噪方法 RNN模型估计算法解码器结构注意力机制线性预测倒谱系数降噪模型深度学习模型梅尔频率倒谱系数 Softmax函数端点检测算法卷积神经网络提取

一种用于混合语音分离、降噪及声音识别的语音处理方法及系统

站点导航

APP 下载