摘要
公开了一种语音识别模型训练方法和装置。该语音识别模型训练方法包括:利用语音识别老师基准模型生成多个无标签语音数据片段的基准伪标签,利用语音识别老师对照模型生成多个无标签语音数据片段的对照伪标签,并计算多个无标签语音数据片段中的每个无标签语音数据片段的对照伪标签相对于基准伪标签的错词率;基于多个无标签语音数据片段、多个无标签语音数据片段的基准伪标签、以及多个无标签语音数据片段中其对照伪标签相对于基准伪标签的错词率低于预定值的无标签语音数据片段的对照伪标签,构建多个无标签语音数据‑伪标签训练数据对;以及基于多个无标签语音数据‑伪标签训练数据对及它们所对应的错词率,训练语音识别学生模型。
技术关键词
标签
数据
计算机可执行指令
多任务损失函数
基准
学生
滑动窗口
老师
处理器
语音识别模型
词嵌入向量
时序
符号
解码器
声学特征
计算机程序产品
序列
训练装置
系统为您推荐了相关专利信息
特征融合方法
滑动窗傅里叶变换
SCADA系统
空间特征提取
电力系统智能分析
星载原子钟
逻辑控制单元
微调单元
处理单元
溯源装置
神经网络模型
视频数据处理方法
图像传感单元
控制器
周期