摘要
本发明公开了一种基于水电噪音的语音自动识别增强方法及系统,属于语音识别及处理技术领域,针对现有神经网络采用的固定形状的卷积核在处理声纹信息时会受到限制,进而影响语音增强性能的问题,采用基于跨维度协同注意力机制和可形变卷积的端到端编‑解码器网络CADNet进行语音增强,在CADNet中通过通道维度自适应映射得到一维卷积内核大小,即通道交互的覆盖范围,保证了语音增强的效率和有效性,同时节约了计算资源。此外,本发明在语音增强和语音识别阶段均采用了注意力机制,注意力机制会关注模型的重要特征并抑制那些不重要的特征,从而提升模型的表示能力,进而提高语音增强和识别的效果。
技术关键词
语音自动识别
水电
双向长短期记忆网络
sigmoid函数
灯泡贯流式水轮发电机组
协同注意力
语音识别网络
网络单元
内核
输出特征
融合特征
双曲正切函数
全局平均池化
信息编码
语音识别模块
通道
机制