一种基于双向门控神经网络及参考噪声的语音增强方法

正文

推荐专利

申请号：CN202510028428

申请日期：2025-01-08

公开号：CN119811405B

公开日期：2025-12-05

类型：发明专利

摘要

本发明提供了一种基于BGRU及参考噪声的语音增强方法，包含以下网络结构：推理时，接受两路输入：参考噪声、带噪语音，两路噪声分别经过短时傅里叶变换编码器输入到增强网络模块，得到噪声估计和语音估计，将语音估计经过逆短时傅里叶变换得到降噪后的语音；训练时，接受四路输入：参考噪声、带噪语音、噪声真值、语音真值，四路噪声分别经过短时傅里叶变化编码器，编码后的参考噪声与带噪语音通过增强网络模块计算，得到噪声估计和语音估计；编码后的语音真值和噪声真值以及噪声估计和语音估计均送入3CL损失模块，计算得到损失后反馈给增强网络模块，调整参数，完善增强网络模块性能。本发明能在极低信噪比的条件下提高语音质量和可懂度。

技术关键词

门控神经网络短时傅里叶变换语音网络模块解码器信号噪声提取傅里叶变换处理记忆输入模块编码器模块计算机可读取存储介质注意力机制线性输出模块处理器

系统为您推荐了相关专利信息

一种医学数字化病例智能管理方法

智能管理方法关键点模板病历疾病

一种无人机电池存储柜

无人机电池充电模组存储柜五孔电源插座重合闸开关

一种通过语音智能生成业务表单的方法、设备及介质

文本生成业务业务表单历史会话分词

一种基于AI的多线益智互动方法及玩具

神经网络声学模型互动方法双向长短期记忆语音活动检测分块特征

一种虚拟现实交互系统、虚拟现实交互方法及其相关设备

全景数据采集虚拟现实交互系统沉浸式环境虚拟现实交互方法物体

一种基于双向门控神经网络及参考噪声的语音增强方法

站点导航

APP 下载