噪声语音识别模型训练和语音识别方法、装置及设备

正文

推荐专利

申请号：CN202510904849

申请日期：2025-07-01

公开号：CN120748379A

公开日期：2025-10-03

类型：发明专利

摘要

本申请公开了一种噪声语音识别模型的训练及语音识别方法、装置及设备。该噪声语音识别模型通过语音表征解耦模块，能够在多变的噪声环境中实现对声学编码器输出的语音表征深度噪声抑制，提取更清晰的干净去噪特征表示输入至Transducer解码器，从而增强整体模型的噪声鲁棒性以及识别性能。基于预测语音识别结果与标准语音识别结果的第一损失，和预测去噪特征表示与标准特征表示的第二损失，确定的目标损失函数，对模型中非固定参数模块进行针对性训练，实现语音表征解耦模块和Transducer解码器的协同优化，最终使得训练完成的噪声语音识别模型在复杂噪声环境下，既能有效去除噪声干扰，又能准确完成语音到文本的转换，提升模型在噪声环境的鲁棒性和识别准确率。

技术关键词

噪声语音识别语音数据语音识别方法噪声特征样本解码器噪声标签识别模型训练噪声鲁棒性语音识别装置编码器参数模块计算机设备噪声分类噪声信息噪声抑制

系统为您推荐了相关专利信息

一种工单管理方法、系统、设备及介质

工单管理方法历史工单数据工单管理系统机器学习算法工单管理技术

一种大语言模型下的动态推理方法和系统

动态推理方法大语言模型分词语句因子

一种基于SDN的电力系统CSI物理层认证安全管理方法、系统、电子设备及存储介质

认证系统管理方法信道状态信息电力系统接入点

随机数生成方法及装置

正确率熵源生成方法序列数据

面向AUV的多尺度轻量化水下图像实例分割模型构建方法

实例分割模型输出特征样本交互式机器人水下图像数据

噪声语音识别模型训练和语音识别方法、装置及设备

站点导航

APP 下载