自监督音乐表征提取方法、装置、设备及介质

正文

推荐专利

申请号：CN202511052026

申请日期：2025-07-29

公开号：CN120808813A

公开日期：2025-10-17

类型：发明专利

摘要

本发明涉及人工智能技术领域，可应用于金融科技、医疗健康等业务系统平台中，揭露了一种自监督音乐表征提取方法、装置、设备及介质，所述方法包括：对第一梅尔频谱进行残差矢量量化，得到若干离散令牌，利用离散令牌重建过程中的组合目标损失函数对初始分词器进行优化，得到目标分词器，对音乐数据集的第二梅尔频谱进行分词，得到若干目标令牌序列，对随机遮蔽后的第二梅尔频谱进行多头自注意力与卷积处理，得到遮蔽位置对应的预测令牌序列，并确定与目标令牌序列之间的交叉熵损失，对表征学习模型进行优化，得到目标音乐表征学习模型，并提取音乐数据集的音乐向量表征。本发明提高了音乐表征的提取效率与可靠性。

技术关键词

音乐令牌矢量量化频谱特征序列更新模型参数声学特征分词注意力短时傅里叶变换数据遮蔽模块语义人工智能技术医疗健康索引电子设备处理器通信业务系统

系统为您推荐了相关专利信息

一种轻量级唇语识别方法与装置

唇语识别方法人脸跟踪检测人脸特征点检测序列分类网络

一种基于时空混沌的区块链信息安全传输方法

区块链信息安全传输方法密文传输系统智能节点耦合映射格子

一种基于RVC网络的闽南语戏曲变声方法及系统

音频变声方法拼音变声系统语义

S蛋白或P4HB蛋白作为靶点在制备预防或治疗新冠感染相关性凝血病变的药物中的应用

蛋白二硫键异构酶编码基因表达新型冠状病毒分子

一种图像处理方法、装置、计算机设备及存储介质

重建人脸三维模型贴图顶点视频图像处理方法

自监督音乐表征提取方法、装置、设备及介质

站点导航

APP 下载