一种基于ResNet18和Transformer双支分支对音乐进行流派分类及其构建的方法

AITNT
正文
推荐专利
一种基于ResNet18和Transformer双支分支对音乐进行流派分类及其构建的方法
申请号:CN202410702211
申请日期:2024-06-01
公开号:CN118538245A
公开日期:2024-08-23
类型:发明专利
摘要
本发明涉及一种基于ResNet18和Transformer双支分支对音乐进行流派分类及其构建的方法,该方法包括:利用分割技术对音频数据进行数据增强;双分支分别利用librosa库对数据增强后的音频数据进行提取梅尔频谱图特征和利用不同长度的SincNet滤波器提取出更具有代表的三通道二维表征;分别将提取好的梅尔频谱图特征输入到Transformer Encoder中,将更具有代表性的三通道二维表征送到ResNet18,最后通过一个全连接层进行拼接然后进行分类。通过本发明可以解决音乐特征不全面、不具有代表性以及音乐数据量过大而分类不准确等问题,为以后构建更准确的音乐推荐系统,提升用户体验和满意度方面提供新思路。
技术关键词
音频特征 注意力机制 前馈神经网络 分支 sinc函数 数据 矩阵乘法运算 短时傅里叶变换 全局平均池化 音乐推荐系统 轮廓信息 低通滤波器 频率响应 功率 三通道
系统为您推荐了相关专利信息
1
焊接系统的避障方法和焊接系统的避障装置
图像采集装置 运送装置 点云 标定关系 坐标系
2
深度学习辅助的代码规范性自动审查方法及系统
代码特征 语法特征 深度学习网络 合规性 变异策略
3
一种基于改进后MobileNetV3-AHFF网络的行星齿轮箱故障诊断方法
行星齿轮箱故障 振动加速度信号 故障诊断模型 半监督学习 邻域
4
动态目标分割方法、装置、介质、设备及程序产品
分割方法 解码器结构 状态空间模型 编码器 动态
5
基于VAE-transformer的癌症临床分期预测方法及系统
基因表达数据 可执行程序代码 编码器 注意力机制 方差特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号