基于多阶段特征融合的鲁棒语音识别方法及系统

正文

推荐专利

申请号：CN202510852205

申请日期：2025-06-24

公开号：CN120544544A

公开日期：2025-08-26

类型：发明专利

摘要

本发明公开了基于多阶段特征融合的鲁棒语音识别方法及系统，涉及语音识别技术领域。本发明针对鲁棒语音识别提供了一种语音识别模型，其首先通过语音编码部从带噪语音Y中提取出幅度谱∣Y∣、并编码成初步特征Ybasic，接着通过语音增强部对Ybasic进行处理以得到隐藏特征Yhidden、掩蔽特征Ymask、映射特征Ymap，然后通过三阶段的特征融合得到融合特征Ffused，最后通过语音解码器对Ffused进行解码以得到Result。本发明的模型增强了过程内部的特征互补、特征交互以及高低层语义对齐，系统地缓解了语音增强引入的语音失真问题，并解决了不同阶段的信息损失，从而保证最终的语音识别效果。

技术关键词

多阶段特征语音识别方法交互式特征语音识别模型融合特征注意力机制语音解码器语音识别系统鲁棒语音识别语音编码批量语音识别技术全局平均池化语音识别模块上采样分支噪声特征

系统为您推荐了相关专利信息

一种基于机器学习的动态人像验证及检查结果生成系统

生成系统关联特征数据生成式对抗网络蒙特卡罗方法递归神经网络

一种端到端基于多层信息融合的方言音频识别方法及系统

融合声学特征交叉注意力机制语音识别模型编码器音频识别方法

一种纱线断线监测方法

纱线关联规则挖掘算法支持向量机模型监测方法信号

一种基于深度学习的深静脉血栓超声图像分割方法

超声图像分割方法图像特征数据下肢深静脉血栓全局平均池化卷积模块

一种基于多模态信息融合的电子凭证分类方法

凭证分类多模态信息融合图像特征集图像特征提取模型文字特征

基于多阶段特征融合的鲁棒语音识别方法及系统

站点导航

APP 下载