基于深度互学习框架的音频特征提取方法、系统及终端

正文

推荐专利

申请号：CN202410763036

申请日期：2024-06-13

公开号：CN118538238B

公开日期：2025-01-28

类型：发明专利

摘要

本发明公开了一种基于深度互学习框架的音频特征提取方法、系统及终端，所述方法包括：获取训练数据集，对训练数据集进行预处理得到预处理训练集；根据预处理训练集对初始Mel谱模型和初始MFCC模型进行深度互学习训练和损失函数调整操作，得到最终Mel谱模型和最终MFCC模型；将目标对象的待处理音频数据分别输入至最终Mel谱模型和最终MFCC模型，得到Mel谱预测值和MFCC预测值；将Mel谱预测值和MFCC预测值进行平均融合处理，得到最终预测特征。本发明通过互训练学习，综合考虑了两个模型的不同视角和特征表达，生成了更为全面和准确的最终预测特征，有效地整合了不同音频特征的优势，提高模型的性能和鲁棒性。

技术关键词

音频特征提取方法训练集数据预测特征框架标签 MFCC特征可读存储介质对象分类器处理器模型更新终端编码器程序模块存储器

系统为您推荐了相关专利信息

报文统计方法、交换芯片和交换机

报文统计方法信号逻辑模块索引

一种基于多归一化与动态网络的类增量学习的图像分类方法及系统

图像分类方法归一化模块图像分类精度动态图像分类系统

一种UHMWPE纤维增强材料超高速撞击损伤的定量识别方法

UHMWPE纤维三维模型定量识别方法训练深度学习模型工业CT检测方法

一种基于云平台的计算机控制系统及方法

计算机控制系统深度强化学习算法决策控制模块生成异常模式弹性调度

结合EMD的LSTM主设备安装热油循环油温预测方法

皮尔逊相关系数变压器 LSTM模型滤油机记忆单元

基于深度互学习框架的音频特征提取方法、系统及终端

站点导航

APP 下载