摘要
本申请公开了一种语音识别模型训练方法、语音识别方法及装置,涉及智能家居技术领域,该语音识别模型训练方法包括:基于第一无噪声语音数据集对生成式预训练Transformer模型进行语音识别训练,得到第一语音识别模型;其中,生成式预训练Transformer模型是通过大模型预训练得到的;基于第一含噪声语音数据集对第一语音识别模型进行语音识别训练,得到第二语音识别模型;使用多任务学习框架,基于噪声抑制任务和语音识别任务联合训练第二语音识别模型,得到第三语音识别模型。本申请提供的语音识别模型训练方法、语音识别方法及装置,基于大模型实现了噪声抑制和语音增强,显著提高了嘈杂环境中的语音识别准确性。
技术关键词
语音识别模型
语音识别训练
噪声语音
语音识别方法
无噪声
噪声抑制
模型预训练
数据
语音识别准确性
无监督学习方法
多任务
语音识别装置
智能家居技术
语音识别模块
神经网络模型
随机噪声
训练装置