摘要
本公开涉及一种语音识别模型训练方法、语音识别方法、装置和存储介质。该方法包括:获取训练音频;根据训练音频的声学信息和语义信息,确定训练音频的第一目标伪标签,第一目标伪标签指示训练音频对应的目标文本;基于训练音频和第一目标伪标签训练初始语音识别模型,得到训练后的语音识别模型。根据本公开实施例,通过获取未标注的训练音频,根据训练音频的声学信息和语义信息,确定训练音频的第一目标伪标签,可以挑选出语义更合理和更有训练价值的标签,从而基于训练音频和第一目标伪标签训练初始语音识别模型,得到训练后的语音识别模型,可以在节约标注成本的同时,提升模型训练和语音识别的效果,得到精度更高的语音识别模型。
技术关键词
语音识别模型
标签
音频
大语言模型
语音识别方法
非易失性计算机可读存储介质
语义
计算机程序指令
文本
拼音
序列
语音识别装置
命名实体识别
处理器
场景
训练装置
模块
存储器
系统为您推荐了相关专利信息
断奶仔猪腹泻
机器学习模型
风险
数据
梯度下降法
影像分割方法
迭代优化算法
构建序列影像
图像像素
标签