摘要
本发明公开了一种基于多头注意力的弱监督音频分类方法及系统,属于音频处理和深度学习技术领域。获取智能外呼系统呼叫失败时的音频历史数据,并标注弱监督标签,再进行预处理,对预处理后的音频历史数据进行梅尔频谱计算,得到梅尔频谱表示,提取得到频谱中的局部模式和相关性,进行降采样,并加入预处理后的音频历史数据中每一帧音频数据的位置信息,得到中间输出;基于多头注意力机制网络和分类网络获得音频的分类结果;并对两个网络的参数更新,获得预训练的多头注意力机制网络和分类网络;利用获得的网络对待分类的音频进行分类,识别得到呼叫失败的原因。本发明可以根据具体需求进行调整和优化,适用于各种规模的音频处理任务。
技术关键词
音频分类方法
多头注意力机制
智能外呼系统
分类网络
机器可读存储介质
音频分类系统
一维卷积神经网络
短时傅里叶变换
标签
深度学习技术
处理器
模块
模式
指令
存储器
参数
滤波器
系统为您推荐了相关专利信息
大语言模型
多设备控制方法
多设备控制装置
机器可读存储介质
指令
LightGBM模型
入侵监测方法
高维特征向量
入侵监测系统
样本
工程机械
泵送系统
动力装置
抑振方法
网络模型训练
滑动窗口
多头注意力机制
识别方法
多层感知机
视频