摘要
本发明公开了一种基于对比学习和因果注意力机制带噪声感知的语音分离方法,该方法包括下述步骤:基于编码器对纯净的源语音信号和含噪混合语音建模,生成源语音信号和含噪混合语音的学习域特征表示;基于掩码网络对源语音信号以及噪声信号进行掩码估计,生成不同声源的估计特征表示;利用源语音、估计语音以及估计噪声三者的学习域特征表示,优化整体网络参数,构建实现噪声感知的对比学习模块;构建解码网络,基于估计特征表示恢复相应时域估计信号,实现语音分离。本发明以较低的参数量和更高的计算效率,在含噪混合语音分离任务中取得超越主流算法的分离效果的同时,兼具实时应用性。
技术关键词
语音特征
噪声特征
采样器
样本
多头注意力机制
解码网络
信号
前馈神经网络
编码器
信噪比
分段
模组
模块
记忆单元
系统为您推荐了相关专利信息
视频
安全事件统计
服务器
数据输入模块
管理终端
感兴趣区域图像
药片
语义分割模型
像素点
深度学习语义分割