一种基于多通道可学习小波变换的语音识别采样方法

正文

推荐专利

申请号：CN202511222260

申请日期：2025-08-29

公开号：CN120998179A

公开日期：2025-11-21

类型：发明专利

摘要

本发明公开了一种基于多通道可学习小波变换的语音识别采样方法，属于自动语音识别技术技术领域；方法为：获取语音信号计算后的fbank频谱图；构建语音识别模型，采用可学习小波变换方法对语音识别模型进行优化；基于优化后的语音识别模型完成语音识别采样。本发明通过利用小波变换具备多分辨率分析能力的特点，能够把信号分解成不同尺度和方向的子信号，降噪处理后再特征融合，有助于模型捕捉音频在不同尺度和方向上的特征；使用自动学习最优的小波滤波器，从而更好地适应不同的音频数据特征，提升了模型的表达能力和泛化性能基于可学习的非线性阈值，能够提高模型抑制噪声和不重要的特征的能力。

技术关键词

采样方法多通道构建语音识别模型小波变换方法高通滤波器低通滤波器卷积模块编码器模块自动语音识别技术采样模块表达式非线性多分辨率信号矩阵音频

系统为您推荐了相关专利信息

一种基于多通道介质传输先验的水下图像增强方法及设备

水下图像增强方法生成式对抗网络水下图像数据多通道深度图

基于自注意力机制的多通道音频处理的实时降噪方法

语谱图多通道注意力机制降噪方法短时傅里叶变换

一种基于双时间特征融合和深度学习的新型窃电检测方法及装置

窃电检测方法特征提取模块时间卷积网络智能电表窃电检测装置

基于无监督和弱监督结合的缺陷分类与分割方法及系统

分割方法语义分割网络无监督样本记忆

基于数字孪生的机场行李系统减速机故障预测诊断方法

数字孪生模型剩余寿命预测模型机场行李系统故障程度评估多维特征向量

一种基于多通道可学习小波变换的语音识别采样方法

站点导航

APP 下载