一种用于混合语音分离、降噪及声音识别的语音处理方法及系统

AITNT
正文
推荐专利
一种用于混合语音分离、降噪及声音识别的语音处理方法及系统
申请号:CN202510543872
申请日期:2025-04-28
公开号:CN120581016A
公开日期:2025-09-02
类型:发明专利
摘要
发明名称:一种用于混合语音分离、降噪及声音识别的语音处理方法及系统摘要:本发明公开了一种用于混合语音分离、降噪及声音识别的语音处理方法及系统,涉及语音处理技术领域,主要组成部分由主要由声纹数据库构建、混合语音分离、自适应噪声抑制及语音识别模块组成,采用CNN‑RNN模型提取声纹特征;通过基于编码器-解码器结构的深度学习模型及注意力机制分离混合语音;采用基于最小统计量的噪声估计算法与多模态降噪方法抑制噪声;对降噪语音提取MFCC、LPCC及深度特征并融合,经自编码器优化后,用改进的支持向量机(SVM)或深度神经网络分类器识别。本发明解决了现有技术在混合语音分离、降噪、声纹识别及处理效率方面的不足,能精确分离已知声纹语音,有效降噪并实现高精度声音识别,满足实时处理需求。
技术关键词
深度神经网络分类器 噪声抑制模块 语音识别模块 声纹特征 支持向量机 编码器 深度学习降噪方法 RNN模型 估计算法 解码器结构 注意力机制 线性预测倒谱系数 降噪模型 深度学习模型 梅尔频率倒谱系数 Softmax函数 端点检测算法 卷积神经网络提取
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号