摘要
本发明涉及人工智能技术领域,可应用于金融科技、医疗健康等业务系统平台中,揭露了一种自监督音乐表征提取方法、装置、设备及介质,所述方法包括:对第一梅尔频谱进行残差矢量量化,得到若干离散令牌,利用离散令牌重建过程中的组合目标损失函数对初始分词器进行优化,得到目标分词器,对音乐数据集的第二梅尔频谱进行分词,得到若干目标令牌序列,对随机遮蔽后的第二梅尔频谱进行多头自注意力与卷积处理,得到遮蔽位置对应的预测令牌序列,并确定与目标令牌序列之间的交叉熵损失,对表征学习模型进行优化,得到目标音乐表征学习模型,并提取音乐数据集的音乐向量表征。本发明提高了音乐表征的提取效率与可靠性。
技术关键词
音乐
令牌
矢量量化
频谱特征
序列
更新模型参数
声学特征
分词
注意力
短时傅里叶变换
数据
遮蔽模块
语义
人工智能技术
医疗健康
索引
电子设备
处理器通信
业务系统
系统为您推荐了相关专利信息
唇语识别方法
人脸跟踪检测
人脸特征点检测
序列
分类网络
区块链信息安全
传输方法
密文传输系统
智能节点
耦合映射格子
蛋白
二硫键异构酶
编码基因表达
新型冠状病毒
分子