一种基于选择性状态空间模型的含噪语音分离方法

正文

推荐专利

申请号：CN202410934275

申请日期：2024-07-12

公开号：CN118782065A

公开日期：2024-10-15

类型：发明专利

摘要

本发明公开了一种基于选择性状态空间模型的含噪语音分离方法，属于语音分离技术领域。该方法在时域语音分离框架中引入具有选择机制的Mamba来设计U型选择性语音分离模块(UMamba)，以提高模型对噪声和语音的区分能力，从而减少含噪语音分离任务中的信号和噪声的误分配问题，并降低了模型的参数量。该方法首先使用一维卷积提取语音特征，然后利用设计的U型选择性语音分离模块(UMamba)进行语音分离，并通过特征精炼器(FeaturePcs)进一步增强分离后的语音特征，最后通过一维反卷积层恢复语音信号，实现端到端的语音分离。最后对所提出的方法进行性能评估，本发明保持很小的模型参数量但能取得优秀的性能，是一种对资源有限的用户十分友好的方法。

技术关键词

语音特征状态空间模型卷积特征精炼器尺寸噪声编码器融合局部特征模块输出特征解码器通道分支信号失真编解码机制

一种基于选择性状态空间模型的含噪语音分离方法

站点导航

APP 下载