摘要
本申请公开了一种基于噪声解构的语音识别模型的训练方法及语音识别方法、装置、设备及介质。采用先隔离训练噪声解缠模块,再微调训练Conformer‑Transducer架构的阶段式训练策略,避免了同时训练多个复杂模块带来的高计算复杂度和训练难度。在隔离训练阶段,可以快速优化噪声解缠模块的性能;在微调训练阶段,利用已训练好的噪声解缠模块,集中精力优化Conformer‑Transducer架构,提高训练效率,减少训练时间和计算资源的消耗。在隔离训练和微调训练过程中,对部分模块的参数进行冻结,减少了需要优化的参数数量,从而降低了计算复杂度。通过噪声解缠模块将语音信号中的噪声和纯净语音进行解构,再结合Conformer‑Transducer架构进行准确的语义理解,使整个语音识别模型对噪声具有更强的鲁棒性。
技术关键词
噪声语音
识别语音数据
编码器
语义标签
语音识别模型
语音识别方法
模块
解码器
参数可调
框架
样本
语音识别装置
计算机设备
优化噪声
复杂度