一种基于特征解耦和对比学习的音频分类方法及装置

正文

推荐专利

申请号：CN202411131516

申请日期：2024-08-18

公开号：CN119132331B

公开日期：2025-07-08

类型：发明专利

摘要

本发明公开了一种基于特征解耦和对比学习的音频分类方法及装置，包括以下步骤：步骤1：获取音频文件以及其对应标签信息，并进行预处理将音频文件转换为波形数据；步骤2：构建音频分类模型，将预处理数据传入进行前向传播，模型具体包含特征提取模块、重构解耦模块以及对比分类模块，其中特征提取模块主要负责将输入音频信息提取为目标粗粒度信息和非目标粗粒度信息；重构解耦模块则根据目标信息与非目标信息的互信息上界结合重构实现信息解耦精细化。本发明能够在有效识别音频中的目标信息的同时，实现兼具精确度和鲁棒性的分类效果。

技术关键词

音频分类方法特征提取模块音频波形数据重构模块音频分类装置多任务损失函数全局平均池化预训练模型标签机制处理器通信输入设备基础算法语义

一种基于特征解耦和对比学习的音频分类方法及装置

站点导航

APP 下载