一种基于双向门控神经网络及参考噪声的语音增强方法

AITNT
正文
推荐专利
一种基于双向门控神经网络及参考噪声的语音增强方法
申请号:CN202510028428
申请日期:2025-01-08
公开号:CN119811405B
公开日期:2025-12-05
类型:发明专利
摘要
本发明提供了一种基于BGRU及参考噪声的语音增强方法,包含以下网络结构:推理时,接受两路输入:参考噪声、带噪语音,两路噪声分别经过短时傅里叶变换编码器输入到增强网络模块,得到噪声估计和语音估计,将语音估计经过逆短时傅里叶变换得到降噪后的语音;训练时,接受四路输入:参考噪声、带噪语音、噪声真值、语音真值,四路噪声分别经过短时傅里叶变化编码器,编码后的参考噪声与带噪语音通过增强网络模块计算,得到噪声估计和语音估计;编码后的语音真值和噪声真值以及噪声估计和语音估计均送入3CL损失模块,计算得到损失后反馈给增强网络模块,调整参数,完善增强网络模块性能。本发明能在极低信噪比的条件下提高语音质量和可懂度。
技术关键词
门控神经网络 短时傅里叶变换 语音 网络模块 解码器 信号 噪声提取 傅里叶变换处理 记忆 输入模块 编码器模块 计算机可读取存储介质 注意力机制 线性 输出模块 处理器
系统为您推荐了相关专利信息
1
一种医学数字化病例智能管理方法
智能管理方法 关键点 模板 病历 疾病
2
一种无人机电池存储柜
无人机电池 充电模组 存储柜 五孔电源插座 重合闸开关
3
一种通过语音智能生成业务表单的方法、设备及介质
文本 生成业务 业务表单 历史会话 分词
4
一种基于AI的多线益智互动方法及玩具
神经网络声学模型 互动方法 双向长短期记忆 语音活动检测 分块特征
5
一种虚拟现实交互系统、虚拟现实交互方法及其相关设备
全景数据采集 虚拟现实交互系统 沉浸式环境 虚拟现实交互方法 物体
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号