摘要
本申请实施例公开了一种语音处理方法、装置、存储介质及计算机设备。该方法包括:获取初始语音信号,通过短时傅里叶变换得到初始语音信号的第一频域信号,并对第一频域信号进行梅尔谱变换得到梅尔频谱,将梅尔频谱输入预设神经网络模型,以输出语音掩码信号的梅尔频谱,其中,语音掩码用于表征不同频率的权重值,对语音掩码信号的梅尔频谱进行梅尔谱反变换得到第二频域信号,根据第一频域信号和第二频域信号计算输出信号,并对输出信号进行短时傅里叶逆变换处理。本申请通过能够同时处理啸叫抑制和语音降噪的神经网络模型生成一个语音掩码,以准确区分信号中的语音成分和噪声成分,从而更准确地识别并抑制噪声,同时保留语音信息。
技术关键词
神经网络模型
语音
信号
短时傅里叶变换
样本
计算机设备
时序特征
门控循环单元
数据
频率
梯度下降法
误差函数
传播算法
参数
处理单元
存储器
麦克风
标签
噪声
系统为您推荐了相关专利信息
混凝土电线杆
识别方法
粒子群优化算法
生成超声波
表达式
降雨强度检测
滑动时间窗口
压电传感器
电压
噪声特征
联动控制方法
驱鸟设备
周边环境信息
多传感器数据融合
风险评估模型
心理检测方法
人脸情绪识别技术
深度学习算法
心理检测系统
特征提取模块
特征提取模块
图像提取特征
图像特征信息
图像特征提取
图像增强模型