摘要
本发明公开了基于多阶段特征融合的鲁棒语音识别方法及系统,涉及语音识别技术领域。本发明针对鲁棒语音识别提供了一种语音识别模型,其首先通过语音编码部从带噪语音Y中提取出幅度谱∣Y∣、并编码成初步特征Ybasic,接着通过语音增强部对Ybasic进行处理以得到隐藏特征Yhidden、掩蔽特征Ymask、映射特征Ymap,然后通过三阶段的特征融合得到融合特征Ffused,最后通过语音解码器对Ffused进行解码以得到Result。本发明的模型增强了过程内部的特征互补、特征交互以及高低层语义对齐,系统地缓解了语音增强引入的语音失真问题,并解决了不同阶段的信息损失,从而保证最终的语音识别效果。
技术关键词
多阶段特征
语音识别方法
交互式特征
语音识别模型
融合特征
注意力机制
语音解码器
语音识别系统
鲁棒语音识别
语音编码
批量
语音识别技术
全局平均池化
语音识别模块
上采样
分支
噪声特征
系统为您推荐了相关专利信息
生成系统
关联特征数据
生成式对抗网络
蒙特卡罗方法
递归神经网络
融合声学特征
交叉注意力机制
语音识别模型
编码器
音频识别方法
纱线
关联规则挖掘算法
支持向量机模型
监测方法
信号
超声图像分割方法
图像特征数据
下肢深静脉血栓
全局平均池化
卷积模块
凭证分类
多模态信息融合
图像特征集
图像特征提取模型
文字特征