噪声语音识别模型训练和语音识别方法、装置及设备

AITNT
正文
推荐专利
噪声语音识别模型训练和语音识别方法、装置及设备
申请号:CN202510904849
申请日期:2025-07-01
公开号:CN120748379A
公开日期:2025-10-03
类型:发明专利
摘要
本申请公开了一种噪声语音识别模型的训练及语音识别方法、装置及设备。该噪声语音识别模型通过语音表征解耦模块,能够在多变的噪声环境中实现对声学编码器输出的语音表征深度噪声抑制,提取更清晰的干净去噪特征表示输入至Transducer解码器,从而增强整体模型的噪声鲁棒性以及识别性能。基于预测语音识别结果与标准语音识别结果的第一损失,和预测去噪特征表示与标准特征表示的第二损失,确定的目标损失函数,对模型中非固定参数模块进行针对性训练,实现语音表征解耦模块和Transducer解码器的协同优化,最终使得训练完成的噪声语音识别模型在复杂噪声环境下,既能有效去除噪声干扰,又能准确完成语音到文本的转换,提升模型在噪声环境的鲁棒性和识别准确率。
技术关键词
噪声语音 识别语音数据 语音识别方法 噪声特征 样本 解码器 噪声标签 识别模型训练 噪声鲁棒性 语音识别装置 编码器参数 模块 计算机设备 噪声分类 噪声信息 噪声抑制
系统为您推荐了相关专利信息
1
一种工单管理方法、系统、设备及介质
工单管理方法 历史工单数据 工单管理系统 机器学习算法 工单管理技术
2
一种大语言模型下的动态推理方法和系统
动态推理方法 大语言模型 分词 语句 因子
3
一种基于SDN的电力系统CSI物理层认证安全管理方法、系统、电子设备及存储介质
认证系统 管理方法 信道状态信息 电力系统 接入点
4
随机数生成方法及装置
正确率 熵源 生成方法 序列 数据
5
面向AUV的多尺度轻量化水下图像实例分割模型构建方法
实例分割模型 输出特征 样本 交互式机器人 水下图像数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号