基于扩张因果卷积和双向门控循环神经网络的语音增强方法

正文

推荐专利

申请号：CN202510565697

申请日期：2025-04-30

公开号：CN120319257A

公开日期：2025-07-15

类型：发明专利

摘要

本发明公开了基于扩张因果卷积和双向门控循环神经网络的语音增强方法，包括将对含噪语音分帧加窗后经傅里叶变换提取频谱特征作为原始输入特征；构建语音增强模型结构，包括噪声输入层、噪声多尺度扩张因果卷积层、通道注意力机制、噪声双向门控循环神经层、去噪层；利用各原始输入特征对语音增强模型结构进行训练获得语音增强模型；利用语音增强模型获得对应的去噪频谱特征，经逆傅里叶变换、加窗处理，获得降噪后的语音信号。本发明利用神经网络模型对噪声特征建模，通过因果卷积和通道压缩技术实现低复杂度深度学习，抑制含噪语音信号中噪声部分，提高语音增强性能，采用8‑bit量化部署，模型体积压缩至2.3MB，具有良好的应用前景。

技术关键词

门控循环神经网络语音活动检测通道注意力机制频谱特征噪声特征时序特征多尺度输出特征听觉感知特性音频编解码器判别语音离散余弦变换噪声分类模型预测值矩阵

系统为您推荐了相关专利信息

一种基于机器视觉的轻量级HAN-YOLO的缺陷检测方法

缺陷检测方法金字塔网络卷积模块视觉计算机操作系统

一种基于近距离无线通讯技术的快速启动功能应用的方法

近距离无线通讯技术加密 NFC标签动态令牌解密密钥

基于多模态时空特性的DNS数据泄露检测方法和系统

数据泄露检测方法深度残差卷积神经网络模块深度特征提取网络多模态

基于量子态协同调控的印章去除及文档修复方法

量子态文档修复方法量子傅里叶变换像素量子纠缠态

一种量子测控数据的处理方法及装置

量子测控数据量子态多通道控制模块噪声特征提取混合预测模型

基于扩张因果卷积和双向门控循环神经网络的语音增强方法

站点导航

APP 下载