一种基于水电噪音的语音自动识别增强方法及系统

正文

推荐专利

申请号：CN202411817858

申请日期：2024-12-11

公开号：CN119673189A

公开日期：2025-03-21

类型：发明专利

摘要

本发明公开了一种基于水电噪音的语音自动识别增强方法及系统，属于语音识别及处理技术领域，针对现有神经网络采用的固定形状的卷积核在处理声纹信息时会受到限制，进而影响语音增强性能的问题，采用基于跨维度协同注意力机制和可形变卷积的端到端编‑解码器网络CADNet进行语音增强，在CADNet中通过通道维度自适应映射得到一维卷积内核大小，即通道交互的覆盖范围，保证了语音增强的效率和有效性，同时节约了计算资源。此外，本发明在语音增强和语音识别阶段均采用了注意力机制，注意力机制会关注模型的重要特征并抑制那些不重要的特征，从而提升模型的表示能力，进而提高语音增强和识别的效果。

技术关键词

语音自动识别水电双向长短期记忆网络 sigmoid函数灯泡贯流式水轮发电机组协同注意力语音识别网络网络单元内核输出特征融合特征双曲正切函数全局平均池化信息编码语音识别模块通道机制

一种基于水电噪音的语音自动识别增强方法及系统

站点导航

APP 下载