摘要
本发明公开了一种基于选择性状态空间模型的含噪语音分离方法,属于语音分离技术领域。该方法在时域语音分离框架中引入具有选择机制的Mamba来设计U型选择性语音分离模块(UMamba),以提高模型对噪声和语音的区分能力,从而减少含噪语音分离任务中的信号和噪声的误分配问题,并降低了模型的参数量。该方法首先使用一维卷积提取语音特征,然后利用设计的U型选择性语音分离模块(UMamba)进行语音分离,并通过特征精炼器(FeaturePcs)进一步增强分离后的语音特征,最后通过一维反卷积层恢复语音信号,实现端到端的语音分离。最后对所提出的方法进行性能评估,本发明保持很小的模型参数量但能取得优秀的性能,是一种对资源有限的用户十分友好的方法。
技术关键词
语音特征
状态空间模型
卷积特征
精炼器
尺寸
噪声
编码器
融合局部特征
模块
输出特征
解码器
通道
分支
信号失真
编解码
机制