一种音频分类方法、装置、设备、存储介质及程序产品

正文

推荐专利

申请号：CN202411934836

申请日期：2024-12-26

公开号：CN120086707A

公开日期：2025-06-03

类型：发明专利

摘要

本申请提供了一种音频分类方法、装置、设备、存储介质及程序产品，涉及音频处理技术领域。通过音频分类模型逐层提取待分类音频数据中不同粒度的音频特征，并将这些特征交给对应层的判别器进行判别，生成包含分类概率的中间判别结果，并对不同粒度的音频特征进行堆叠以构建特征基座。最终判别器根据各个中间判别结果的置信度和重要性，给予各中间判别结果不同的权重，并结合对特征基座的判别结果，输出音频分类结果。实现更精细化的特征提取，使音频分类模型通过更细致丰富的音频特征和包含分类概率的中间判别结果输出音频分类结果，提高了音频分类结果的准确率和音频分类模型的鲁棒性，有效解决了现有音频分类方法准确率低、鲁棒性差的技术问题。

技术关键词

音频特征音频分类方法训练特征降噪模式基座音频分类装置计算机程序产品短时傅里叶变换生成特征向量更新模型参数数据堆叠模块处理器可读存储介质鲁棒性判别模块语音

系统为您推荐了相关专利信息

圆柱形电芯极耳整形机构和极耳整形流水线

整形机构电芯负极定位传感器胶辊

改进粒子群优化的非单例区间二型模糊PID空间机械臂跟踪控制方法

模糊PID控制器空间机械臂系统误差模糊规则跟踪控制方法

一种支持情绪化语音输出的多模态智能问答与推荐系统

推荐系统情感特征答案卷积模块多模态

基于语音输入的个性化全身动作生成方法

动作生成方法音频特征头部模型节奏特征人体模型

偏好网络模型的训练方法、推荐方法、装置、设备及介质

偏好特征音频特征推荐方法三元组损失函数样本

一种音频分类方法、装置、设备、存储介质及程序产品

站点导航

APP 下载