模型训练及语音识别方法、装置、设备及介质

正文

推荐专利

申请号：CN202510614431

申请日期：2025-05-13

公开号：CN120472886A

公开日期：2025-08-12

类型：发明专利

摘要

本申请公开了一种基于噪声解构的语音识别模型的训练方法及语音识别方法、装置、设备及介质。采用先隔离训练噪声解缠模块，再微调训练Conformer‑Transducer架构的阶段式训练策略，避免了同时训练多个复杂模块带来的高计算复杂度和训练难度。在隔离训练阶段，可以快速优化噪声解缠模块的性能；在微调训练阶段，利用已训练好的噪声解缠模块，集中精力优化Conformer‑Transducer架构，提高训练效率，减少训练时间和计算资源的消耗。在隔离训练和微调训练过程中，对部分模块的参数进行冻结，减少了需要优化的参数数量，从而降低了计算复杂度。通过噪声解缠模块将语音信号中的噪声和纯净语音进行解构，再结合Conformer‑Transducer架构进行准确的语义理解，使整个语音识别模型对噪声具有更强的鲁棒性。

技术关键词

噪声语音识别语音数据编码器语义标签语音识别模型语音识别方法模块解码器参数可调框架样本语音识别装置计算机设备优化噪声复杂度

模型训练及语音识别方法、装置、设备及介质

站点导航

APP 下载