摘要
本申请涉及一种语音增强方法及系统,属于语音增强技术领域,语音增强方法包括构建语音增强网络;所述语音增强网络包括依次连接的编码器、音噪分离器以及解码器;获取待处理的音频数据,并将音频数据输入至语音增强网络中,通过编码器从音频数据中提取不同维度的L个时域特征;通过音噪分离器对L个时域特征分别进行提取,并将提取结果映射到预设特征集合中;通过解码器对维度最高的时域特征和对应的预设特征集合中的每个提取结果进行融合处理,以得到去噪增强语音和/或背景音。在非稳定噪声环境中,语音增强网络能够快速适应噪声特性的变化,实时进行噪声抑制和语音增强,本申请具有提升了语音增强的稳定性和性能的效果。
技术关键词
时域特征
编码器
分离器
噪声特征
输出模块
注意力
语音解码器
融合特征
音频
神经网络模型
语音特征
数据
处理器
噪声抑制
输出端