一种基于选择性状态空间模型的含噪语音分离方法

AITNT
正文
推荐专利
一种基于选择性状态空间模型的含噪语音分离方法
申请号:CN202410934275
申请日期:2024-07-12
公开号:CN118782065A
公开日期:2024-10-15
类型:发明专利
摘要
本发明公开了一种基于选择性状态空间模型的含噪语音分离方法,属于语音分离技术领域。该方法在时域语音分离框架中引入具有选择机制的Mamba来设计U型选择性语音分离模块(UMamba),以提高模型对噪声和语音的区分能力,从而减少含噪语音分离任务中的信号和噪声的误分配问题,并降低了模型的参数量。该方法首先使用一维卷积提取语音特征,然后利用设计的U型选择性语音分离模块(UMamba)进行语音分离,并通过特征精炼器(FeaturePcs)进一步增强分离后的语音特征,最后通过一维反卷积层恢复语音信号,实现端到端的语音分离。最后对所提出的方法进行性能评估,本发明保持很小的模型参数量但能取得优秀的性能,是一种对资源有限的用户十分友好的方法。
技术关键词
语音特征 状态空间模型 卷积特征 精炼器 尺寸 噪声 编码器 融合局部特征 模块 输出特征 解码器 通道 分支 信号失真 编解码 机制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号