摘要
本申请提供了一种音频分类方法、装置、设备、存储介质及程序产品,涉及音频处理技术领域。通过音频分类模型逐层提取待分类音频数据中不同粒度的音频特征,并将这些特征交给对应层的判别器进行判别,生成包含分类概率的中间判别结果,并对不同粒度的音频特征进行堆叠以构建特征基座。最终判别器根据各个中间判别结果的置信度和重要性,给予各中间判别结果不同的权重,并结合对特征基座的判别结果,输出音频分类结果。实现更精细化的特征提取,使音频分类模型通过更细致丰富的音频特征和包含分类概率的中间判别结果输出音频分类结果,提高了音频分类结果的准确率和音频分类模型的鲁棒性,有效解决了现有音频分类方法准确率低、鲁棒性差的技术问题。
技术关键词
音频特征
音频分类方法
训练特征
降噪模式
基座
音频分类装置
计算机程序产品
短时傅里叶变换
生成特征向量
更新模型参数
数据
堆叠模块
处理器
可读存储介质
鲁棒性
判别模块
语音
系统为您推荐了相关专利信息
模糊PID控制器
空间机械臂
系统误差
模糊规则
跟踪控制方法
动作生成方法
音频特征
头部模型
节奏特征
人体模型
偏好特征
音频特征
推荐方法
三元组损失函数
样本