语音处理方法、装置、存储介质及计算机设备

AITNT
正文
推荐专利
语音处理方法、装置、存储介质及计算机设备
申请号:CN202411647252
申请日期:2024-11-18
公开号:CN119517068A
公开日期:2025-02-25
类型:发明专利
摘要
本申请实施例公开了一种语音处理方法、装置、存储介质及计算机设备。该方法包括:获取初始语音信号,通过短时傅里叶变换得到初始语音信号的第一频域信号,并对第一频域信号进行梅尔谱变换得到梅尔频谱,将梅尔频谱输入预设神经网络模型,以输出语音掩码信号的梅尔频谱,其中,语音掩码用于表征不同频率的权重值,对语音掩码信号的梅尔频谱进行梅尔谱反变换得到第二频域信号,根据第一频域信号和第二频域信号计算输出信号,并对输出信号进行短时傅里叶逆变换处理。本申请通过能够同时处理啸叫抑制和语音降噪的神经网络模型生成一个语音掩码,以准确区分信号中的语音成分和噪声成分,从而更准确地识别并抑制噪声,同时保留语音信息。
技术关键词
神经网络模型 语音 信号 短时傅里叶变换 样本 计算机设备 时序特征 门控循环单元 数据 频率 梯度下降法 误差函数 传播算法 参数 处理单元 存储器 麦克风 标签 噪声
系统为您推荐了相关专利信息
1
基于深度学习的混凝土电线杆隐患识别方法
混凝土电线杆 识别方法 粒子群优化算法 生成超声波 表达式
2
一种承载雨滴下落击打的降雨强度检测方法及装置
降雨强度检测 滑动时间窗口 压电传感器 电压 噪声特征
3
机场鸟情监控预警驱鸟设备联动控制方法
联动控制方法 驱鸟设备 周边环境信息 多传感器数据融合 风险评估模型
4
一种基于人工智能的心理检测方法及系统
心理检测方法 人脸情绪识别技术 深度学习算法 心理检测系统 特征提取模块
5
低光图像增强方法、装置、电子设备和计算机可读介质
特征提取模块 图像提取特征 图像特征信息 图像特征提取 图像增强模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号