一种语音增强与语音识别级联系统及其设计方法

正文

推荐专利

申请号：CN202510274619

申请日期：2025-03-10

公开号：CN120048260A

公开日期：2025-05-27

类型：发明专利

摘要

本发明提供了一种语音增强与语音识别级联系统及其设计方法，所述系统包括语音增强模块和语音识别模块，采用短时傅里叶变换对输入的语音信号进行时频变换后输入到语音增强模块，所述语音增强模块基于双向长短期记忆网络构建，对语音增强模块的输出进行时频逆变换得到预增强的语音信号，将预增强的语音信号输入到语音识别模块中进行语音识别并输出语音识别结果，所述语音识别模块包括若干个改进的DC‑Conformer模块作为编码器，并包括若干个Transformer模块作为解码器，所述改进的DC‑Conformer模块为将动态组合多头注意力机制引入语音识别任务中的Conformer模块中，通过应用动态组合多头注意力机制，实现语音增强与语音识别级联系统的性能提升。

技术关键词

级联系统语音识别模块多头注意力机制短时傅里叶变换映射技术双向长短期记忆语音识别模型语音识别系统解码器编码器信号动态策略数据时序

系统为您推荐了相关专利信息

一种水下矢量推进器的故障诊断方法

水下矢量推进器历史故障数据故障诊断方法混合深度学习模型多源异构数据

一种基于混合Mamba注意力分割模型的混凝土裂缝检测方法

解码器编码器抑制背景噪声空间模块裂缝特征

一种基于光纤微振动监测的地震预报方法及系统

地震预报方法空间特征参数短时傅里叶变换监测点频率

基于时空动态图聚类的节假日地铁客流预测方法及系统

地铁客流预测方法站点聚类算法节点卷积网络模型

基于多模态融合对抗学习的电力通信设备故障诊断方法及系统

电力通信设备故障诊断方法多模态故障分类器融合特征

一种语音增强与语音识别级联系统及其设计方法

站点导航

APP 下载