摘要
本发明公开一种基于深度特征提取的旋律提取方法、系统及相关产品,属于音乐信息检索技术领域。本发明利用残差神经网络层、最大池化层和双向长短时记忆网络层提取第二频谱图的特征,得到特征向量;利用卷积循环神经网络层提取第二频谱图的特征,得到特征向量,将二者串联融合为特征向量;最后通过半监督极限学习机网络模型提取得到待处理音频信号的旋律。本方法通过残差神经网络、双向长短时记忆网络与卷积循环神经网络的协同作用,分别提取第二频谱图的深层时序特征和局部频域特征,通过串联融合实现多模态特征互补,增强旋律特征的表征能力,解决传统SSELM模型依赖单一网络结构导致特征表达不足的问题,提高旋律提取的准确率。
技术关键词
旋律提取方法
深度特征提取
短时傅里叶变换
极限学习机网络
音频
半监督极限学习机
信号
卷积循环神经网络
幅值
频率
矩阵
索引
信息检索技术
残差神经网络
多模态特征
采样率
计算机程序产品
处理器
频域特征
时序特征
系统为您推荐了相关专利信息
人机互动方法
堆叠结构
解码器
融合特征
多模态特征融合
实时音频信息
声纹特征
物联网智能传感器
开关控制方法
智能家居设备
信号识别方法
信号识别模型
噪声识别
信号智能识别
联合损失函数