摘要
本发明公开了一种基于深度互学习框架的音频特征提取方法、系统及终端,所述方法包括:获取训练数据集,对训练数据集进行预处理得到预处理训练集;根据预处理训练集对初始Mel谱模型和初始MFCC模型进行深度互学习训练和损失函数调整操作,得到最终Mel谱模型和最终MFCC模型;将目标对象的待处理音频数据分别输入至最终Mel谱模型和最终MFCC模型,得到Mel谱预测值和MFCC预测值;将Mel谱预测值和MFCC预测值进行平均融合处理,得到最终预测特征。本发明通过互训练学习,综合考虑了两个模型的不同视角和特征表达,生成了更为全面和准确的最终预测特征,有效地整合了不同音频特征的优势,提高模型的性能和鲁棒性。
技术关键词
音频特征提取方法
训练集
数据
预测特征
框架
标签
MFCC特征
可读存储介质
对象
分类器
处理器
模型更新
终端
编码器
程序
模块
存储器
系统为您推荐了相关专利信息
电力高空作业
优化卡尔曼滤波
跟踪方法
协方差矩阵
运动补偿
分类方法
残差网络
生成位置信息
卷积神经网络模型
多层感知机
滑动环组件
污水管网
流量监测设备
超声波接收
发射组件
智能公交站台
预警系统
智能设备
多算法融合
公交站台设备
光伏功率预测方法
一维卷积神经网络
多层感知机
数据
表达式