摘要
本发明公开了一种模型训练方法、语音识别方法、装置、设备及存储介质,其中模型训练方法包括:获取合成语音数据集和真实语音数据集并构建语音识别模型,模型包括编码器、适配模块和解码器;利用合成语音数据集对编码器和解码器进行预训练;冻结预训练后的解码器参数,利用真实语音数据集对编码器参数和适配模块参数进行微调。本发明有效解决了合成语音与真实语音之间的域偏移问题,在少量真实语音数据情况下显著提升模型性能,同时通过冻结解码器防止灾难性遗忘,保持了模型的通用能力,模型泛化能力强,适用于低资源场景下的语音识别应用。
技术关键词
模型训练方法
构建语音识别模型
语音识别方法
解码器
语音识别文本
数据
适配器
分类准确率
模块
样本
语音识别装置
编码器参数
模型训练装置
计算机设备
处理器
程序