一种基于多通道可学习小波变换的语音识别采样方法

AITNT
正文
推荐专利
一种基于多通道可学习小波变换的语音识别采样方法
申请号:CN202511222260
申请日期:2025-08-29
公开号:CN120998179A
公开日期:2025-11-21
类型:发明专利
摘要
本发明公开了一种基于多通道可学习小波变换的语音识别采样方法,属于自动语音识别技术技术领域;方法为:获取语音信号计算后的fbank频谱图;构建语音识别模型,采用可学习小波变换方法对语音识别模型进行优化;基于优化后的语音识别模型完成语音识别采样。本发明通过利用小波变换具备多分辨率分析能力的特点,能够把信号分解成不同尺度和方向的子信号,降噪处理后再特征融合,有助于模型捕捉音频在不同尺度和方向上的特征;使用自动学习最优的小波滤波器,从而更好地适应不同的音频数据特征,提升了模型的表达能力和泛化性能基于可学习的非线性阈值,能够提高模型抑制噪声和不重要的特征的能力。
技术关键词
采样方法 多通道 构建语音识别模型 小波变换方法 高通滤波器 低通滤波器 卷积模块 编码器模块 自动语音识别技术 采样模块 表达式 非线性 多分辨率 信号 矩阵 音频
系统为您推荐了相关专利信息
1
一种基于多通道介质传输先验的水下图像增强方法及设备
水下图像增强方法 生成式对抗网络 水下图像数据 多通道 深度图
2
基于自注意力机制的多通道音频处理的实时降噪方法
语谱图 多通道 注意力机制 降噪方法 短时傅里叶变换
3
一种基于双时间特征融合和深度学习的新型窃电检测方法及装置
窃电检测方法 特征提取模块 时间卷积网络 智能电表 窃电检测装置
4
基于无监督和弱监督结合的缺陷分类与分割方法及系统
分割方法 语义分割网络 无监督 样本 记忆
5
基于数字孪生的机场行李系统减速机故障预测诊断方法
数字孪生模型 剩余寿命预测模型 机场行李系统 故障程度评估 多维特征向量
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号