摘要
发明名称:一种用于混合语音分离、降噪及声音识别的语音处理方法及系统摘要:本发明公开了一种用于混合语音分离、降噪及声音识别的语音处理方法及系统,涉及语音处理技术领域,主要组成部分由主要由声纹数据库构建、混合语音分离、自适应噪声抑制及语音识别模块组成,采用CNN‑RNN模型提取声纹特征;通过基于编码器-解码器结构的深度学习模型及注意力机制分离混合语音;采用基于最小统计量的噪声估计算法与多模态降噪方法抑制噪声;对降噪语音提取MFCC、LPCC及深度特征并融合,经自编码器优化后,用改进的支持向量机(SVM)或深度神经网络分类器识别。本发明解决了现有技术在混合语音分离、降噪、声纹识别及处理效率方面的不足,能精确分离已知声纹语音,有效降噪并实现高精度声音识别,满足实时处理需求。
技术关键词
深度神经网络分类器
噪声抑制模块
语音识别模块
声纹特征
支持向量机
编码器
深度学习降噪方法
RNN模型
估计算法
解码器结构
注意力机制
线性预测倒谱系数
降噪模型
深度学习模型
梅尔频率倒谱系数
Softmax函数
端点检测算法
卷积神经网络提取