摘要
本发明涉及语音识别技术,提供一种基于元数据增强的语音识别模型预训练方法、语音识别方法及系统。其中语音识别模型预训练方法包括:获取语音识别数据集,所述语音识别数据集由不同语种的语音‑文本对组成,从所述语音识别数据集中N种语种中采样N个任务以形成批次数据集,将所述批次数据集中的每个任务分为支持集和查询集;基于所述批次数据集对语音识别模型进行元训练,提取训练过程中在所述语音识别模型的指定隐藏层中的批次数据集并进行数据扰动,得到扰动数据集;对应的,所述扰动数据集中每个任务包含扰动支持集和扰动查询集;将所述批次数据集和所述扰动数据集进行混合增强后对每个语种进行训练并更新所述语音识别模型参数。
技术关键词
语音识别模型
预训练方法
数据
编码器适配器
语音识别方法
文本
语音特征
参数
语音识别系统
语音识别技术
语音识别模块
模型训练模块
样本
处理器
存储器
非线性
电子设备
系统为您推荐了相关专利信息
分区划分方法
图形处理
标识
计算机程序代码
激光
性能测试分析方法
涂层
性能测试数据
钢结构
海洋环境数据
决策树模型
CART决策树
车辆
风险
机器学习训练