摘要
本发明涉及声学场景分类方案设计技术领域,具体涉及一种基于模型融合的声学场景分类方法及系统、电子设备。本发明搭建了三种分类模型,并将本发明搭建的三个模型进行融合使用,将十类声学场景进一步划分为三大类,并构建了一个三分类器用于学习相似场景间的上层共享特征。在三分类器和十分类器中均引入数据增强和模型融合策略,搭建了一个基于模型融合的多层次声学场景分类模型,本发明将十分类器与三分类器的输出在后期进行融合以提升模型整体性能,很大程度上提高了声学场景分类的准确性和可靠性,实现了针对声学场景分类问题在跨设备情况下提高神经网络模型的泛化性能及分类准确率。
技术关键词
声学场景分类方法
残差网络
分类器
注意力
计算机可读指令
方案设计技术
频率
通道
ReLU函数
噪声源
频段
电子设备
分类准确率
城市公园
神经网络模型
有轨电车
融合策略
分类系统
系统为您推荐了相关专利信息
变电站电力设备
故障检测方法
特征提取模型
噪声抑制
注意力
特征融合网络
遥感图像分割方法
融合特征
训练集
图像分割装置
肝部CT图像
深度学习模型
信息分析方法
跨模态融合特征
模态特征