摘要
本发明公开了一种音乐理解模型训练方法、音频处理方法、设备和介质,应用于计算机技术领域,包括:通过初始音乐理解模型对歌曲音频进行压缩得到音频压缩表征;音频压缩表征包含音色信息、情感信息和语义信息中的任一项或多项;通过初始音乐理解模型对歌曲音频的音高序列进行编码处理,以得到包含旋律信息的旋律压缩表征;基于音频压缩表征和旋律压缩表征构建融合压缩表征;基于融合压缩表征和音频压缩表征对初始音乐理解模型进行优化,得到音乐理解模型。本发明通过音高序列保留旋律的音高轨迹,直接剥离了冗余信息,实现对旋律特征的语义聚焦,基于音高序列得到的旋律压缩表征,还保留了音乐前后强关联的特性,更适用于对音乐旋律的特性学习。
技术关键词
模型训练方法
音乐
音频
序列
融合特征
编码特征
模型优化方法
输出特征
多分支结构
语义
采样点
计算机程序产品
频谱特征
处理器
重构
可读存储介质
编码器
电子设备
系统为您推荐了相关专利信息
语音交互系统
语音交互方法
语音特征
音频设备
语音交互装置
计算机可执行指令
实时数据
爬虫
异常数据处理
电力
二硫键异构酶
重组蛋白
诊断血栓性疾病
检测芯片
核酸分子
强化学习模型
融合特征
轨迹特征
多模态特征融合
动态