摘要
本发明涉及一种基于ResNet18和Transformer双支分支对音乐进行流派分类及其构建的方法,该方法包括:利用分割技术对音频数据进行数据增强;双分支分别利用librosa库对数据增强后的音频数据进行提取梅尔频谱图特征和利用不同长度的SincNet滤波器提取出更具有代表的三通道二维表征;分别将提取好的梅尔频谱图特征输入到Transformer Encoder中,将更具有代表性的三通道二维表征送到ResNet18,最后通过一个全连接层进行拼接然后进行分类。通过本发明可以解决音乐特征不全面、不具有代表性以及音乐数据量过大而分类不准确等问题,为以后构建更准确的音乐推荐系统,提升用户体验和满意度方面提供新思路。
技术关键词
音频特征
注意力机制
前馈神经网络
分支
sinc函数
数据
矩阵乘法运算
短时傅里叶变换
全局平均池化
音乐推荐系统
轮廓信息
低通滤波器
频率响应
功率
三通道
系统为您推荐了相关专利信息
代码特征
语法特征
深度学习网络
合规性
变异策略
行星齿轮箱故障
振动加速度信号
故障诊断模型
半监督学习
邻域
基因表达数据
可执行程序代码
编码器
注意力机制
方差特征