基于深度互学习框架的音频特征提取方法、系统及终端

AITNT
正文
推荐专利
基于深度互学习框架的音频特征提取方法、系统及终端
申请号:CN202410763036
申请日期:2024-06-13
公开号:CN118538238B
公开日期:2025-01-28
类型:发明专利
摘要
本发明公开了一种基于深度互学习框架的音频特征提取方法、系统及终端,所述方法包括:获取训练数据集,对训练数据集进行预处理得到预处理训练集;根据预处理训练集对初始Mel谱模型和初始MFCC模型进行深度互学习训练和损失函数调整操作,得到最终Mel谱模型和最终MFCC模型;将目标对象的待处理音频数据分别输入至最终Mel谱模型和最终MFCC模型,得到Mel谱预测值和MFCC预测值;将Mel谱预测值和MFCC预测值进行平均融合处理,得到最终预测特征。本发明通过互训练学习,综合考虑了两个模型的不同视角和特征表达,生成了更为全面和准确的最终预测特征,有效地整合了不同音频特征的优势,提高模型的性能和鲁棒性。
技术关键词
音频特征提取方法 训练集 数据 预测特征 框架 标签 MFCC特征 可读存储介质 对象 分类器 处理器 模型更新 终端 编码器 程序 模块 存储器
系统为您推荐了相关专利信息
1
一种电力高空作业多目标跟踪方法及系统
电力高空作业 优化卡尔曼滤波 跟踪方法 协方差矩阵 运动补偿
2
米粒的品质评级分类方法
分类方法 残差网络 生成位置信息 卷积神经网络模型 多层感知机
3
基于无线通信的管网污水流量监测设备及监管系统
滑动环组件 污水管网 流量监测设备 超声波接收 发射组件
4
一种智能公交站台的智能设备故障诊断与预警系统
智能公交站台 预警系统 智能设备 多算法融合 公交站台设备
5
一种深层注意力网络的光伏功率预测方法
光伏功率预测方法 一维卷积神经网络 多层感知机 数据 表达式
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号