基于多头注意力的弱监督音频分类方法及系统

正文

推荐专利

申请号：CN202411022619

申请日期：2024-07-29

公开号：CN118553266B

公开日期：2024-10-11

类型：发明专利

摘要

本发明公开了一种基于多头注意力的弱监督音频分类方法及系统，属于音频处理和深度学习技术领域。获取智能外呼系统呼叫失败时的音频历史数据，并标注弱监督标签，再进行预处理，对预处理后的音频历史数据进行梅尔频谱计算，得到梅尔频谱表示，提取得到频谱中的局部模式和相关性，进行降采样，并加入预处理后的音频历史数据中每一帧音频数据的位置信息，得到中间输出；基于多头注意力机制网络和分类网络获得音频的分类结果；并对两个网络的参数更新，获得预训练的多头注意力机制网络和分类网络；利用获得的网络对待分类的音频进行分类，识别得到呼叫失败的原因。本发明可以根据具体需求进行调整和优化，适用于各种规模的音频处理任务。

技术关键词

音频分类方法多头注意力机制智能外呼系统分类网络机器可读存储介质音频分类系统一维卷积神经网络短时傅里叶变换标签深度学习技术处理器模块模式指令存储器参数滤波器

系统为您推荐了相关专利信息

多设备控制方法、装置、计算设备及机器可读存储介质

大语言模型多设备控制方法多设备控制装置机器可读存储介质指令

一种基于融合模型的高效车联网实时入侵监测系统

LightGBM模型入侵监测方法高维特征向量入侵监测系统样本

用于工程机械的抑振方法、装置、存储介质及工程机械

工程机械泵送系统动力装置抑振方法网络模型训练

一种基于自适应滑动窗口多头自注意力的行为识别方法及系统

滑动窗口多头注意力机制识别方法多层感知机视频

基于VLSNR+MMOE组合式融合结构的多模态多任务皮肤护理推荐方法

护肤品皮肤护理推荐方法图文注意力编码器

基于多头注意力的弱监督音频分类方法及系统

站点导航

APP 下载