语音识别模型训练方法、装置和计算机设备

正文

推荐专利

语音识别模型训练方法、装置和计算机设备

申请号：CN202510696530

申请日期：2025-05-28

公开号：CN120220654B

公开日期：2025-08-05

类型：发明专利

摘要

本申请涉及一种语音识别模型训练方法、装置和计算机设备。所述方法包括：获取待标注音频文件集中每个待标注音频文件的多个第一识别结果；多个所述第一识别结果由多个语音识别模型对所述待标注音频文件进行语音识别得到；通过每个所述待标注音频文件的多个所述第一识别结果，对相应的所述待标注音频文件进行自动标注处理，确定每个所述待标注音频文件的标注结果和结果置信度；所述自动标注处理包括投票验证和片段验证；整合每个所述待标注音频文件以及对应的标注结果和结果置信度，生成标注数据集；根据所述标注数据集，对预设语音识别算法进行训练，得到目标语音识别模型。采用本方法能够降低训练成本和提高模型准确率。

技术关键词

生成音频文件语音识别模型语音识别算法文本处理算法语音生成模型计算机设备数据线字符队列训练装置处理器可读存储介质模块存储器

语音识别模型训练方法、装置和计算机设备

站点导航

APP 下载