融合语音增强前端的噪声鲁棒性流式语音识别方法及模型

正文

推荐专利

申请号：CN202510130554

申请日期：2025-02-06

公开号：CN119601017B

公开日期：2025-04-08

类型：发明专利

摘要

本申请提供了一种融合语音增强前端的噪声鲁棒性流式语音识别方法及模型，该模型的训练方法包括获取语音识别训练集；利用因果语音增强网络处理语音训练样本，得到包含全局信息的目标滤波器组特征；利用基于滤波器组的特征提取方法处理语音训练样本，得到原始滤波器组特征；利用注意力机制网络对目标滤波器组特征和原始滤波器组特征进行动态加权融合处理，得到包含语音训练样本中补充信息的目标融合特征；利用初始语音识别网络处理目标融合特征，得到训练文本识别信息；根据目标滤波器组特征、训练文本识别信息和识别文本标签，生成目标损失结果；根据目标损失结果迭代地调整初始语音识别模型的网络参数，得到语音增强识别模型。

技术关键词

融合特征注意力解码语音识别网络滤波器文本识别感知特征流式语音识别方法语音识别训练编码特征语音识别模型加权特征频谱特征识别语音信息时序噪声鲁棒性长短期记忆网络

系统为您推荐了相关专利信息

一种基于ZYNQ架构的动态可重构信号处理平台

ZYNQ架构信号处理平台动态可重构 AD采样单元处理单元

一种断路器设备的可靠性诊断方法、介质及系统

断路器设备诊断方法断路器机械故障融合特征方程

基于多模态融合的出行选址方法和系统

融合深度神经网络模型时序特征规模多模态跨模态

基于深度学习的增程式矿用自卸车能量优化系统及方法

矿用自卸车能量分配策略需求预测模型设备状态数据能量管理模块

一种基于Inception-GAN的HRRP雷达目标识别方法

GAN网络模型深度强化学习空间结构特征识别方法 GAN模型

融合语音增强前端的噪声鲁棒性流式语音识别方法及模型

站点导航

APP 下载