摘要
本发明提供了一种基于BGRU及参考噪声的语音增强方法,包含以下网络结构:推理时,接受两路输入:参考噪声、带噪语音,两路噪声分别经过短时傅里叶变换编码器输入到增强网络模块,得到噪声估计和语音估计,将语音估计经过逆短时傅里叶变换得到降噪后的语音;训练时,接受四路输入:参考噪声、带噪语音、噪声真值、语音真值,四路噪声分别经过短时傅里叶变化编码器,编码后的参考噪声与带噪语音通过增强网络模块计算,得到噪声估计和语音估计;编码后的语音真值和噪声真值以及噪声估计和语音估计均送入3CL损失模块,计算得到损失后反馈给增强网络模块,调整参数,完善增强网络模块性能。本发明能在极低信噪比的条件下提高语音质量和可懂度。
技术关键词
门控神经网络
短时傅里叶变换
语音
网络模块
解码器
信号
噪声提取
傅里叶变换处理
记忆
输入模块
编码器模块
计算机可读取存储介质
注意力机制
线性
输出模块
处理器
系统为您推荐了相关专利信息
无人机电池
充电模组
存储柜
五孔电源插座
重合闸开关
神经网络声学模型
互动方法
双向长短期记忆
语音活动检测
分块特征
全景数据采集
虚拟现实交互系统
沉浸式环境
虚拟现实交互方法
物体