摘要
本发明属于音乐信息检索领域,具体涉及一种音频处理方法及相关装置。音频处理方法包括以下步骤:对音频文件进行预处理,转换为频谱图;采用预先构建的特征提取模型对频谱图进行特征提取,得到特征向量;采用预先构建的基于流Transformer编码器的神经网络模型对特征向量进行处理,得到节拍激活值和强拍激活值;基于节拍激活值和强拍激活值,采用概率模型推断得到节拍序列和强拍序列。解决了现有方法存在的无法准确跟踪节拍序列问题。
技术关键词
特征提取模型
注意力
神经网络模型
动态贝叶斯网络
编码器
音频
特征提取模块
多通道
短时傅里叶变换
序列
标签
可读存储介质
频率
处理器
信息检索
非线性
分块
计算机设备