基于MC-CNN与多任务学习的音频识别方法、系统及设备

AITNT
正文
推荐专利
基于MC-CNN与多任务学习的音频识别方法、系统及设备
申请号:CN202510039895
申请日期:2025-01-10
公开号:CN120690176A
公开日期:2025-09-23
类型:发明专利
摘要
本发明提出了基于MC‑CNN与多任务学习的音频识别方法、系统及设备,包括以下步骤:S1、输入原始语音信号;S2、使用自适应时频分解方法,根据所述语音信号的瞬时特性,动态调整时间窗和基函数,输出多分辨率、多尺度的时频特征图;S3、根据多阶段卷积神经网络对步骤S2的时频特征图进行特征提取;S4、利用多任务学习框架,优化语音内容识别与噪声分类任务,输出语音识别结果;相较现有的语音识别技术在噪声抑制、计算复杂度和时序建模能力的不足,本发明通过引入MC‑CNN,将语音信号的特征提取过程划分为多阶段,这种逐级优化的特征提取方法不仅能够更有效地捕捉语音信号的时序特性,还能显著降低模型对噪声干扰的敏感性,提升识别的鲁棒性。
技术关键词
音频识别方法 多任务 音频识别系统 多阶段 噪声分类 多分辨率 优化噪声 卷积神经网络模块 音频识别设备 傅里叶基函数 处理器执行指令 多尺度 特征提取方法 语音识别技术 信号 识别误差 重建误差 框架 噪声抑制
系统为您推荐了相关专利信息
1
一种基于深度学习的心电数据异常识别方法、装置、设备及存储介质
异常信号 时间序列特征 异常识别方法 学习模型识别 心脏健康
2
基于NVIDIA AGX ORIN平台的SPECT数据处理系统及方法
数据收集板 数模转换板 数据处理系统 数据处理方法 板卡
3
一种基于多源异构的大孔径波纹管涵潜在损伤预测方法及系统
波纹管涵 损伤预测方法 多模态融合机制 光纤光栅应变传感器 多源异构数据
4
用于富视觉文档中非文本对象分析与理解的统一解决方法
大语言模型 视觉 文本 对象 多任务
5
一种对溶剂分子的光电特性进行预测的处理方法和装置
回归预测模型 分子 特征提取模块 融合特征 多任务
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号