摘要
本发明公开了一种基于自适应卷积的超轻量级语音增强神经网络系统及方法。其系统包括编码器:频谱压缩模块,用于对含噪语音频谱进行动态范围和频率维度的压缩;自适应卷积注意力模块,用于通过自适应卷积层和时间通道注意力对压缩后的特征图做频率维度的降采样和特征的提取分析,然后将特征图送入增强器;增强器:双路径分组循环神经网络,用于对语音的子带时间特征和帧内频率特征进行建模;解码器:自适应转置卷积注意力模块,用于对增强器输出的特征图做频率维度的升采样和特征重建;频谱扩张模块,用于对自适应转置卷积注意力模块输出的特征图的频率维度进行扩张。本发明可以以极低的计算复杂度实现较高性能的语音增强。
技术关键词
神经网络系统
注意力
线性单元
语音
频率
短时傅里叶变换
模块
通道
编码器
解码器
动态
输出特征
掩膜
阶段
参数
批量
复杂度
滤波器
高性能
误差
系统为您推荐了相关专利信息
油田电动修井机
远控系统
力反馈操作台
分布式声波传感系统
数字孪生驱动
体积特征
视频检测方法
运动特征
自然场景
特征提取网络