摘要
本发明提供一种音频评价模型训练方法、音频评价方法、设备及程序产品,涉及人工智能领域,可利用初始音频评价模型对标注音频、未标注音频、未标注音频对应的掩码后音频进行特征提取,得到第一音频表征向量、第二音频表征向量、第三音频表征向量,利用第一音频表征向量确定标注音频的预测质量评分,并可利用每个未标注音频对应的第二音频表征向量和第三音频表征向量间的特征距离、标注音频的每种音频质量评分对应的第一音频表征向量间的特征距离、每个标注音频的预测质量评分与对应音频质量评分间的差值生成第一损失值,进而可根据第一损失值对初始音频评价模型进行训练,能够通过半监督对比学习方式降低对标注音频的需求并提升模型训练效果。
技术关键词
模型训练方法
音频评价方法
文本
计算机可执行指令
音乐
音频特征提取
模块
可读存储介质
存储计算机程序
计算机程序产品
序列
处理器
参数
电子设备
存储器
系统为您推荐了相关专利信息
语音识别模型
编码特征
样本
解码网络
语音识别方法
团队
微调方法
大语言模型
计算机可读取存储介质
数据