摘要
本发明公开了一种基于深度互学习框架的音频特征提取方法、系统及终端,所述方法包括:获取训练数据集,对训练数据集进行预处理得到预处理训练集;根据预处理训练集对初始Mel谱模型和初始MFCC模型进行深度互学习训练和损失函数调整操作,得到最终Mel谱模型和最终MFCC模型;将目标对象的待处理音频数据分别输入至最终Mel谱模型和最终MFCC模型,得到Mel谱预测值和MFCC预测值;将Mel谱预测值和MFCC预测值进行平均融合处理,得到最终预测特征。本发明通过互训练学习,综合考虑了两个模型的不同视角和特征表达,生成了更为全面和准确的最终预测特征,有效地整合了不同音频特征的优势,提高模型的性能和鲁棒性。
技术关键词
音频特征提取方法
训练集
数据
预测特征
框架
标签
MFCC特征
可读存储介质
对象
分类器
处理器
模型更新
终端
编码器
程序
模块
存储器
系统为您推荐了相关专利信息
图像分类方法
归一化模块
图像分类精度
动态
图像分类系统
UHMWPE纤维
三维模型
定量识别方法
训练深度学习模型
工业CT检测方法
计算机控制系统
深度强化学习算法
决策控制模块
生成异常模式
弹性调度
皮尔逊相关系数
变压器
LSTM模型
滤油机
记忆单元