一种音频分类方法、装置、设备、存储介质及程序产品

AITNT
正文
推荐专利
一种音频分类方法、装置、设备、存储介质及程序产品
申请号:CN202411934836
申请日期:2024-12-26
公开号:CN120086707A
公开日期:2025-06-03
类型:发明专利
摘要
本申请提供了一种音频分类方法、装置、设备、存储介质及程序产品,涉及音频处理技术领域。通过音频分类模型逐层提取待分类音频数据中不同粒度的音频特征,并将这些特征交给对应层的判别器进行判别,生成包含分类概率的中间判别结果,并对不同粒度的音频特征进行堆叠以构建特征基座。最终判别器根据各个中间判别结果的置信度和重要性,给予各中间判别结果不同的权重,并结合对特征基座的判别结果,输出音频分类结果。实现更精细化的特征提取,使音频分类模型通过更细致丰富的音频特征和包含分类概率的中间判别结果输出音频分类结果,提高了音频分类结果的准确率和音频分类模型的鲁棒性,有效解决了现有音频分类方法准确率低、鲁棒性差的技术问题。
技术关键词
音频特征 音频分类方法 训练特征 降噪模式 基座 音频分类装置 计算机程序产品 短时傅里叶变换 生成特征向量 更新模型参数 数据 堆叠模块 处理器 可读存储介质 鲁棒性 判别模块 语音
系统为您推荐了相关专利信息
1
圆柱形电芯极耳整形机构和极耳整形流水线
整形机构 电芯 负极 定位传感器 胶辊
2
改进粒子群优化的非单例区间二型模糊PID空间机械臂跟踪控制方法
模糊PID控制器 空间机械臂 系统误差 模糊规则 跟踪控制方法
3
一种支持情绪化语音输出的多模态智能问答与推荐系统
推荐系统 情感特征 答案 卷积模块 多模态
4
基于语音输入的个性化全身动作生成方法
动作生成方法 音频特征 头部模型 节奏特征 人体模型
5
偏好网络模型的训练方法、推荐方法、装置、设备及介质
偏好特征 音频特征 推荐方法 三元组损失函数 样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号