语音处理方法、装置、存储介质及计算机设备

正文

推荐专利

申请号：CN202411647252

申请日期：2024-11-18

公开号：CN119517068A

公开日期：2025-02-25

类型：发明专利

摘要

本申请实施例公开了一种语音处理方法、装置、存储介质及计算机设备。该方法包括：获取初始语音信号，通过短时傅里叶变换得到初始语音信号的第一频域信号，并对第一频域信号进行梅尔谱变换得到梅尔频谱，将梅尔频谱输入预设神经网络模型，以输出语音掩码信号的梅尔频谱，其中，语音掩码用于表征不同频率的权重值，对语音掩码信号的梅尔频谱进行梅尔谱反变换得到第二频域信号，根据第一频域信号和第二频域信号计算输出信号，并对输出信号进行短时傅里叶逆变换处理。本申请通过能够同时处理啸叫抑制和语音降噪的神经网络模型生成一个语音掩码，以准确区分信号中的语音成分和噪声成分，从而更准确地识别并抑制噪声，同时保留语音信息。

技术关键词

神经网络模型语音信号短时傅里叶变换样本计算机设备时序特征门控循环单元数据频率梯度下降法误差函数传播算法参数处理单元存储器麦克风标签噪声

系统为您推荐了相关专利信息

基于深度学习的混凝土电线杆隐患识别方法

混凝土电线杆识别方法粒子群优化算法生成超声波表达式

一种承载雨滴下落击打的降雨强度检测方法及装置

降雨强度检测滑动时间窗口压电传感器电压噪声特征

机场鸟情监控预警驱鸟设备联动控制方法

联动控制方法驱鸟设备周边环境信息多传感器数据融合风险评估模型

一种基于人工智能的心理检测方法及系统

心理检测方法人脸情绪识别技术深度学习算法心理检测系统特征提取模块

低光图像增强方法、装置、电子设备和计算机可读介质

特征提取模块图像提取特征图像特征信息图像特征提取图像增强模型

语音处理方法、装置、存储介质及计算机设备

站点导航

APP 下载