基于扩张因果卷积和双向门控循环神经网络的语音增强方法

AITNT
正文
推荐专利
基于扩张因果卷积和双向门控循环神经网络的语音增强方法
申请号:CN202510565697
申请日期:2025-04-30
公开号:CN120319257A
公开日期:2025-07-15
类型:发明专利
摘要
本发明公开了基于扩张因果卷积和双向门控循环神经网络的语音增强方法,包括将对含噪语音分帧加窗后经傅里叶变换提取频谱特征作为原始输入特征;构建语音增强模型结构,包括噪声输入层、噪声多尺度扩张因果卷积层、通道注意力机制、噪声双向门控循环神经层、去噪层;利用各原始输入特征对语音增强模型结构进行训练获得语音增强模型;利用语音增强模型获得对应的去噪频谱特征,经逆傅里叶变换、加窗处理,获得降噪后的语音信号。本发明利用神经网络模型对噪声特征建模,通过因果卷积和通道压缩技术实现低复杂度深度学习,抑制含噪语音信号中噪声部分,提高语音增强性能,采用8‑bit量化部署,模型体积压缩至2.3MB,具有良好的应用前景。
技术关键词
门控循环神经网络 语音活动检测 通道注意力机制 频谱特征 噪声特征 时序特征 多尺度 输出特征 听觉感知特性 音频编解码器 判别语音 离散余弦变换 噪声分类 模型预测值 矩阵
系统为您推荐了相关专利信息
1
一种基于机器视觉的轻量级HAN-YOLO的缺陷检测方法
缺陷检测方法 金字塔网络 卷积模块 视觉 计算机操作系统
2
一种基于近距离无线通讯技术的快速启动功能应用的方法
近距离无线通讯技术 加密 NFC标签 动态令牌 解密密钥
3
基于多模态时空特性的DNS数据泄露检测方法和系统
数据泄露检测方法 深度残差 卷积神经网络模块 深度特征提取网络 多模态
4
基于量子态协同调控的印章去除及文档修复方法
量子态 文档修复方法 量子傅里叶变换 像素 量子纠缠态
5
一种量子测控数据的处理方法及装置
量子测控数据 量子态 多通道控制模块 噪声特征提取 混合预测模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号