摘要
本发明公开了一种基于多通道可学习小波变换的语音识别采样方法,属于自动语音识别技术技术领域;方法为:获取语音信号计算后的fbank频谱图;构建语音识别模型,采用可学习小波变换方法对语音识别模型进行优化;基于优化后的语音识别模型完成语音识别采样。本发明通过利用小波变换具备多分辨率分析能力的特点,能够把信号分解成不同尺度和方向的子信号,降噪处理后再特征融合,有助于模型捕捉音频在不同尺度和方向上的特征;使用自动学习最优的小波滤波器,从而更好地适应不同的音频数据特征,提升了模型的表达能力和泛化性能基于可学习的非线性阈值,能够提高模型抑制噪声和不重要的特征的能力。
技术关键词
采样方法
多通道
构建语音识别模型
小波变换方法
高通滤波器
低通滤波器
卷积模块
编码器模块
自动语音识别技术
采样模块
表达式
非线性
多分辨率
信号
矩阵
音频
系统为您推荐了相关专利信息
水下图像增强方法
生成式对抗网络
水下图像数据
多通道
深度图
语谱图
多通道
注意力机制
降噪方法
短时傅里叶变换
窃电检测方法
特征提取模块
时间卷积网络
智能电表
窃电检测装置
数字孪生模型
剩余寿命预测模型
机场行李系统
故障程度评估
多维特征向量