摘要
本发明提出了基于MC‑CNN与多任务学习的音频识别方法、系统及设备,包括以下步骤:S1、输入原始语音信号;S2、使用自适应时频分解方法,根据所述语音信号的瞬时特性,动态调整时间窗和基函数,输出多分辨率、多尺度的时频特征图;S3、根据多阶段卷积神经网络对步骤S2的时频特征图进行特征提取;S4、利用多任务学习框架,优化语音内容识别与噪声分类任务,输出语音识别结果;相较现有的语音识别技术在噪声抑制、计算复杂度和时序建模能力的不足,本发明通过引入MC‑CNN,将语音信号的特征提取过程划分为多阶段,这种逐级优化的特征提取方法不仅能够更有效地捕捉语音信号的时序特性,还能显著降低模型对噪声干扰的敏感性,提升识别的鲁棒性。
技术关键词
音频识别方法
多任务
音频识别系统
多阶段
噪声分类
多分辨率
优化噪声
卷积神经网络模块
音频识别设备
傅里叶基函数
处理器执行指令
多尺度
特征提取方法
语音识别技术
信号
识别误差
重建误差
框架
噪声抑制
系统为您推荐了相关专利信息
异常信号
时间序列特征
异常识别方法
学习模型识别
心脏健康
数据收集板
数模转换板
数据处理系统
数据处理方法
板卡
波纹管涵
损伤预测方法
多模态融合机制
光纤光栅应变传感器
多源异构数据
回归预测模型
分子
特征提取模块
融合特征
多任务