摘要
本发明公开了一种基于特征解耦和对比学习的音频分类方法及装置,包括以下步骤:步骤1:获取音频文件以及其对应标签信息,并进行预处理将音频文件转换为波形数据;步骤2:构建音频分类模型,将预处理数据传入进行前向传播,模型具体包含特征提取模块、重构解耦模块以及对比分类模块,其中特征提取模块主要负责将输入音频信息提取为目标粗粒度信息和非目标粗粒度信息;重构解耦模块则根据目标信息与非目标信息的互信息上界结合重构实现信息解耦精细化。本发明能够在有效识别音频中的目标信息的同时,实现兼具精确度和鲁棒性的分类效果。
技术关键词
音频分类方法
特征提取模块
音频波形数据
重构模块
音频分类装置
多任务损失函数
全局平均池化
预训练模型
标签
机制
处理器通信
输入设备
基础
算法
语义