基于MC-CNN与多任务学习的音频识别方法、系统及设备

正文

推荐专利

申请号：CN202510039895

申请日期：2025-01-10

公开号：CN120690176A

公开日期：2025-09-23

类型：发明专利

摘要

本发明提出了基于MC‑CNN与多任务学习的音频识别方法、系统及设备，包括以下步骤：S1、输入原始语音信号；S2、使用自适应时频分解方法，根据所述语音信号的瞬时特性，动态调整时间窗和基函数，输出多分辨率、多尺度的时频特征图；S3、根据多阶段卷积神经网络对步骤S2的时频特征图进行特征提取；S4、利用多任务学习框架，优化语音内容识别与噪声分类任务，输出语音识别结果；相较现有的语音识别技术在噪声抑制、计算复杂度和时序建模能力的不足，本发明通过引入MC‑CNN，将语音信号的特征提取过程划分为多阶段，这种逐级优化的特征提取方法不仅能够更有效地捕捉语音信号的时序特性，还能显著降低模型对噪声干扰的敏感性，提升识别的鲁棒性。

技术关键词

音频识别方法多任务音频识别系统多阶段噪声分类多分辨率优化噪声卷积神经网络模块音频识别设备傅里叶基函数处理器执行指令多尺度特征提取方法语音识别技术信号识别误差重建误差框架噪声抑制

系统为您推荐了相关专利信息

一种基于深度学习的心电数据异常识别方法、装置、设备及存储介质

异常信号时间序列特征异常识别方法学习模型识别心脏健康

基于NVIDIA AGX ORIN平台的SPECT数据处理系统及方法

数据收集板数模转换板数据处理系统数据处理方法板卡

一种基于多源异构的大孔径波纹管涵潜在损伤预测方法及系统

波纹管涵损伤预测方法多模态融合机制光纤光栅应变传感器多源异构数据

用于富视觉文档中非文本对象分析与理解的统一解决方法

大语言模型视觉文本对象多任务

一种对溶剂分子的光电特性进行预测的处理方法和装置

回归预测模型分子特征提取模块融合特征多任务

基于MC-CNN与多任务学习的音频识别方法、系统及设备

站点导航

APP 下载