摘要
本发明公开了基于扩张因果卷积和双向门控循环神经网络的语音增强方法,包括将对含噪语音分帧加窗后经傅里叶变换提取频谱特征作为原始输入特征;构建语音增强模型结构,包括噪声输入层、噪声多尺度扩张因果卷积层、通道注意力机制、噪声双向门控循环神经层、去噪层;利用各原始输入特征对语音增强模型结构进行训练获得语音增强模型;利用语音增强模型获得对应的去噪频谱特征,经逆傅里叶变换、加窗处理,获得降噪后的语音信号。本发明利用神经网络模型对噪声特征建模,通过因果卷积和通道压缩技术实现低复杂度深度学习,抑制含噪语音信号中噪声部分,提高语音增强性能,采用8‑bit量化部署,模型体积压缩至2.3MB,具有良好的应用前景。
技术关键词
门控循环神经网络
语音活动检测
通道注意力机制
频谱特征
噪声特征
时序特征
多尺度
输出特征
听觉感知特性
音频编解码器
判别语音
离散余弦变换
噪声分类
模型预测值
矩阵
系统为您推荐了相关专利信息
缺陷检测方法
金字塔网络
卷积模块
视觉
计算机操作系统
近距离无线通讯技术
加密
NFC标签
动态令牌
解密密钥
数据泄露检测方法
深度残差
卷积神经网络模块
深度特征提取网络
多模态
量子态
文档修复方法
量子傅里叶变换
像素
量子纠缠态
量子测控数据
量子态
多通道控制模块
噪声特征提取
混合预测模型