基于多阶段特征融合的鲁棒语音识别方法及系统

AITNT
正文
推荐专利
基于多阶段特征融合的鲁棒语音识别方法及系统
申请号:CN202510852205
申请日期:2025-06-24
公开号:CN120544544A
公开日期:2025-08-26
类型:发明专利
摘要
本发明公开了基于多阶段特征融合的鲁棒语音识别方法及系统,涉及语音识别技术领域。本发明针对鲁棒语音识别提供了一种语音识别模型,其首先通过语音编码部从带噪语音Y中提取出幅度谱∣Y∣、并编码成初步特征Ybasic,接着通过语音增强部对Ybasic进行处理以得到隐藏特征Yhidden、掩蔽特征Ymask、映射特征Ymap,然后通过三阶段的特征融合得到融合特征Ffused,最后通过语音解码器对Ffused进行解码以得到Result。本发明的模型增强了过程内部的特征互补、特征交互以及高低层语义对齐,系统地缓解了语音增强引入的语音失真问题,并解决了不同阶段的信息损失,从而保证最终的语音识别效果。
技术关键词
多阶段特征 语音识别方法 交互式特征 语音识别模型 融合特征 注意力机制 语音解码器 语音识别系统 鲁棒语音识别 语音编码 批量 语音识别技术 全局平均池化 语音识别模块 上采样 分支 噪声特征
系统为您推荐了相关专利信息
1
一种基于机器学习的动态人像验证及检查结果生成系统
生成系统 关联特征数据 生成式对抗网络 蒙特卡罗方法 递归神经网络
2
一种端到端基于多层信息融合的方言音频识别方法及系统
融合声学特征 交叉注意力机制 语音识别模型 编码器 音频识别方法
3
一种纱线断线监测方法
纱线 关联规则挖掘算法 支持向量机模型 监测方法 信号
4
一种基于深度学习的深静脉血栓超声图像分割方法
超声图像分割方法 图像特征数据 下肢深静脉血栓 全局平均池化 卷积模块
5
一种基于多模态信息融合的电子凭证分类方法
凭证分类 多模态信息融合 图像特征集 图像特征提取模型 文字特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号