一种语音增强与语音识别级联系统及其设计方法

AITNT
正文
推荐专利
一种语音增强与语音识别级联系统及其设计方法
申请号:CN202510274619
申请日期:2025-03-10
公开号:CN120048260A
公开日期:2025-05-27
类型:发明专利
摘要
本发明提供了一种语音增强与语音识别级联系统及其设计方法,所述系统包括语音增强模块和语音识别模块,采用短时傅里叶变换对输入的语音信号进行时频变换后输入到语音增强模块,所述语音增强模块基于双向长短期记忆网络构建,对语音增强模块的输出进行时频逆变换得到预增强的语音信号,将预增强的语音信号输入到语音识别模块中进行语音识别并输出语音识别结果,所述语音识别模块包括若干个改进的DC‑Conformer模块作为编码器,并包括若干个Transformer模块作为解码器,所述改进的DC‑Conformer模块为将动态组合多头注意力机制引入语音识别任务中的Conformer模块中,通过应用动态组合多头注意力机制,实现语音增强与语音识别级联系统的性能提升。
技术关键词
级联系统 语音识别模块 多头注意力机制 短时傅里叶变换 映射技术 双向长短期记忆 语音识别模型 语音识别系统 解码器 编码器 信号 动态 策略 数据 时序
系统为您推荐了相关专利信息
1
一种水下矢量推进器的故障诊断方法
水下矢量推进器 历史故障数据 故障诊断方法 混合深度学习模型 多源异构数据
2
一种基于混合Mamba注意力分割模型的混凝土裂缝检测方法
解码器 编码器 抑制背景噪声 空间模块 裂缝特征
3
一种基于光纤微振动监测的地震预报方法及系统
地震预报方法 空间特征参数 短时傅里叶变换 监测点 频率
4
基于时空动态图聚类的节假日地铁客流预测方法及系统
地铁客流预测方法 站点 聚类算法 节点 卷积网络模型
5
基于多模态融合对抗学习的电力通信设备故障诊断方法及系统
电力通信设备 故障诊断方法 多模态 故障分类器 融合特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号