摘要
本发明公开了一种基于LSTM+GAT的音乐情感分类方法,提取音乐的低层描述符特征和梅尔频率倒谱系数特征;利用LSTM网络对提取的特征进行时序建模;基于k近邻算法构建特征间的关系图,在此基础上构建双层GAT结构;通过全连接层将特征映射到目标情感类别空间。本发明结合了长短期记忆网络(LSTM)的时序建模能力和图注意力网络(GAT)的关系学习优势,提出了一种三阶段的“时序‑关系‑融合”特征学习框架。该框架有效提高了音乐情感分类的准确率,同时保持了良好的可解释性。通过分析注意力权重,可以评估不同音乐特征对情感分类的贡献。此外,该框架实现了从低层时序特征到高层语义特征的渐进式学习,能够更全面地捕捉音乐特征之间的多维关联性。
技术关键词
音乐情感分类方法
多头注意力机制
时序特征
高层语义特征
音乐特征提取
近邻算法
情感类别
描述符
节点特征
捕捉音乐
长短期记忆网络
离散余弦变换
分类准确率
频谱特征
频率