摘要
本申请涉及一种语音识别模型获取方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,涉及语音识别技术领域,能够提高在无标注的应用场景下的语音识别模型训练精度及模型的泛化能力。所述方法包括:获取无标注的语音训练数据;对语音训练数据进行数据清洗,得到清洗后的语音训练数据;获取预训练语音识别模型,并通过该模型,对清洗后的语音训练数据进行伪标签预测,得到带标签的第一语音训练数据;对带标签的第一语音训练数据中的伪标签进行文本纠错,及对带标签的第一语音训练数据中的语音训练数据进行语音修正,得到带标签的第二语音训练数据;根据带标签的第二语音训练数据,对预训练语音识别模型进行调整,得到目标语音识别模型。
技术关键词
语音识别模型
带标签
纠错
文本
计算机设备
计算机程序产品
可读存储介质
语音识别技术
数据获取模块
处理器
存储器
场景
精度
系统为您推荐了相关专利信息
语音唤醒控制方法
智能家电
云平台
指令
唤醒控制系统
厚度计算方法
神经网络模型
输电线路覆冰厚度
对象
构建深度学习网络
注意力
光谱特征提取
融合特征
计算机设备
高光谱相机
识别码
充电公头
充电机构
停机坪
无人机精准降落