摘要
本发明提供了一种语音增强与语音识别级联系统及其设计方法,所述系统包括语音增强模块和语音识别模块,采用短时傅里叶变换对输入的语音信号进行时频变换后输入到语音增强模块,所述语音增强模块基于双向长短期记忆网络构建,对语音增强模块的输出进行时频逆变换得到预增强的语音信号,将预增强的语音信号输入到语音识别模块中进行语音识别并输出语音识别结果,所述语音识别模块包括若干个改进的DC‑Conformer模块作为编码器,并包括若干个Transformer模块作为解码器,所述改进的DC‑Conformer模块为将动态组合多头注意力机制引入语音识别任务中的Conformer模块中,通过应用动态组合多头注意力机制,实现语音增强与语音识别级联系统的性能提升。
技术关键词
级联系统
语音识别模块
多头注意力机制
短时傅里叶变换
映射技术
双向长短期记忆
语音识别模型
语音识别系统
解码器
编码器
信号
动态
策略
数据
时序
系统为您推荐了相关专利信息
水下矢量推进器
历史故障数据
故障诊断方法
混合深度学习模型
多源异构数据
地震预报方法
空间特征参数
短时傅里叶变换
监测点
频率
地铁客流预测方法
站点
聚类算法
节点
卷积网络模型
电力通信设备
故障诊断方法
多模态
故障分类器
融合特征