自监督音乐表征提取方法、装置、设备及介质

AITNT
正文
推荐专利
自监督音乐表征提取方法、装置、设备及介质
申请号:CN202511052026
申请日期:2025-07-29
公开号:CN120808813A
公开日期:2025-10-17
类型:发明专利
摘要
本发明涉及人工智能技术领域,可应用于金融科技、医疗健康等业务系统平台中,揭露了一种自监督音乐表征提取方法、装置、设备及介质,所述方法包括:对第一梅尔频谱进行残差矢量量化,得到若干离散令牌,利用离散令牌重建过程中的组合目标损失函数对初始分词器进行优化,得到目标分词器,对音乐数据集的第二梅尔频谱进行分词,得到若干目标令牌序列,对随机遮蔽后的第二梅尔频谱进行多头自注意力与卷积处理,得到遮蔽位置对应的预测令牌序列,并确定与目标令牌序列之间的交叉熵损失,对表征学习模型进行优化,得到目标音乐表征学习模型,并提取音乐数据集的音乐向量表征。本发明提高了音乐表征的提取效率与可靠性。
技术关键词
音乐 令牌 矢量量化 频谱特征 序列 更新模型参数 声学特征 分词 注意力 短时傅里叶变换 数据 遮蔽模块 语义 人工智能技术 医疗健康 索引 电子设备 处理器通信 业务系统
系统为您推荐了相关专利信息
1
一种轻量级唇语识别方法与装置
唇语识别方法 人脸跟踪检测 人脸特征点检测 序列 分类网络
2
一种基于时空混沌的区块链信息安全传输方法
区块链信息安全 传输方法 密文传输系统 智能节点 耦合映射格子
3
一种基于RVC网络的闽南语戏曲变声方法及系统
音频 变声方法 拼音 变声系统 语义
4
S蛋白或P4HB蛋白作为靶点在制备预防或治疗新冠感染相关性凝血病变的药物中的应用
蛋白 二硫键异构酶 编码基因表达 新型冠状病毒 分子
5
一种图像处理方法、装置、计算机设备及存储介质
重建人脸三维模型 贴图 顶点 视频 图像处理方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号