摘要
本发明提供一种翻唱识别模型训练方法、翻唱识别方法、设备、程序产品,涉及人工智能领域,可利用初始翻唱识别模型分别提取原唱音频和翻唱音频的旋律特征,以及利用初始翻唱识别模型分别提取原唱音频和翻唱音频的语义特征。随后,可利用原唱音频和翻唱音频二者的旋律特征间的相似度确定第一损失、利用原唱音频和翻唱音频二者的语义特征间的相似度确定第二损失,并利用原唱音频和翻唱音频二者的旋律特征和语义特征间的相似度确定第三损失,最后可由第一损失、第二损失、第三损失确定的总损失训练初始翻唱识别模型,可控制模型学习原唱音频和翻唱音频在旋律、语义方面的相似度以及旋律、语义间的跨维度相似度,从而可提升翻唱识别效果。
技术关键词
识别模型训练方法
音频
语义特征
识别方法
计算机可执行指令
三元组
变换器
分支
编码特征
解码模块
压缩编码器
编码模块
可读存储介质
存储计算机程序
计算机程序产品
网络
处理器
系统为您推荐了相关专利信息
轨旁设备
语义分割网络
车载相机
学习算法
中心服务器
特征提取方法
复杂度特征
定义特征
计算机可执行指令
标志位
模型优化方法
文本生成方法
音频
文本生成装置
通信接口
数据平台
识别方法
计算机设备
文本
特征提取网络