一种基于ResNet18和Transformer双支分支对音乐进行流派分类及其构建的方法

正文

推荐专利

申请号：CN202410702211

申请日期：2024-06-01

公开号：CN118538245A

公开日期：2024-08-23

类型：发明专利

摘要

本发明涉及一种基于ResNet18和Transformer双支分支对音乐进行流派分类及其构建的方法，该方法包括：利用分割技术对音频数据进行数据增强；双分支分别利用librosa库对数据增强后的音频数据进行提取梅尔频谱图特征和利用不同长度的SincNet滤波器提取出更具有代表的三通道二维表征；分别将提取好的梅尔频谱图特征输入到Transformer Encoder中，将更具有代表性的三通道二维表征送到ResNet18，最后通过一个全连接层进行拼接然后进行分类。通过本发明可以解决音乐特征不全面、不具有代表性以及音乐数据量过大而分类不准确等问题，为以后构建更准确的音乐推荐系统，提升用户体验和满意度方面提供新思路。

技术关键词

音频特征注意力机制前馈神经网络分支 sinc函数数据矩阵乘法运算短时傅里叶变换全局平均池化音乐推荐系统轮廓信息低通滤波器频率响应功率三通道

系统为您推荐了相关专利信息

焊接系统的避障方法和焊接系统的避障装置

图像采集装置运送装置点云标定关系坐标系

深度学习辅助的代码规范性自动审查方法及系统

代码特征语法特征深度学习网络合规性变异策略

一种基于改进后MobileNetV3-AHFF网络的行星齿轮箱故障诊断方法

行星齿轮箱故障振动加速度信号故障诊断模型半监督学习邻域

动态目标分割方法、装置、介质、设备及程序产品

分割方法解码器结构状态空间模型编码器动态

基于VAE-transformer的癌症临床分期预测方法及系统

基因表达数据可执行程序代码编码器注意力机制方差特征

一种基于ResNet18和Transformer双支分支对音乐进行流派分类及其构建的方法

站点导航

APP 下载