语音识别模型训练方法、语音识别方法、装置和存储介质

正文

推荐专利

申请号：CN202410977647

申请日期：2024-07-19

公开号：CN118711573B

公开日期：2025-08-29

类型：发明专利

摘要

本公开涉及一种语音识别模型训练方法、语音识别方法、装置和存储介质。该方法包括：获取训练音频；根据训练音频的声学信息和语义信息，确定训练音频的第一目标伪标签，第一目标伪标签指示训练音频对应的目标文本；基于训练音频和第一目标伪标签训练初始语音识别模型，得到训练后的语音识别模型。根据本公开实施例，通过获取未标注的训练音频，根据训练音频的声学信息和语义信息，确定训练音频的第一目标伪标签，可以挑选出语义更合理和更有训练价值的标签，从而基于训练音频和第一目标伪标签训练初始语音识别模型，得到训练后的语音识别模型，可以在节约标注成本的同时，提升模型训练和语音识别的效果，得到精度更高的语音识别模型。

技术关键词

语音识别模型标签音频大语言模型语音识别方法非易失性计算机可读存储介质语义计算机程序指令文本拼音序列语音识别装置命名实体识别处理器场景训练装置模块存储器

系统为您推荐了相关专利信息

一种预测断奶仔猪腹泻风险等级的方法

断奶仔猪腹泻机器学习模型风险数据梯度下降法

基于几何迭代优化融合的多序列影像分割方法

影像分割方法迭代优化算法构建序列影像图像像素标签

一种基于大语言模型的中药问答方法、装置、设备及介质

大语言模型问答方法无监督中药文本

一种基于大模型有监督微调的转子打滑根因溯源调控方法

调控方法工况参数适配器技术转子措施

一种家畜识别方法、装置、电子设备及存储介质

家畜模态特征数据融合特征识别方法

语音识别模型训练方法、语音识别方法、装置和存储介质

站点导航

APP 下载