摘要
本发明提供一种语音识别处理方法、装置及电子设备,获取待识别音频,其中,所述待识别音频包括噪音;将所述待识别音频输入至预先训练得到的语音识别模型,得到所述语音识别模型输出的与所述待识别音频对应的识别结果,其中,所述语音识别模型至少包括语音分词器、连续特征编码模块、适配器,以及自回归语言大模型,所述语音识别模型通过训练样本集基于端到端预训练得到,所述训练样本集中的训练样本由带噪音的音频样本、所述带噪音的音频样本的增强处理后音频样本,以及所述带噪音的音频样本的文本标签构成。实现了能够在多种带噪环境下,提高语音识别准确率和鲁棒性。
技术关键词
语音识别模型
音频
训练样本集
连续特征
编码模块
适配器
文本
标签
语音识别准确率
电子设备
处理器
识别模块
存储器
鲁棒性
噪声