一种基于水电噪音的语音自动识别增强方法及系统

AITNT
正文
推荐专利
一种基于水电噪音的语音自动识别增强方法及系统
申请号:CN202411817858
申请日期:2024-12-11
公开号:CN119673189A
公开日期:2025-03-21
类型:发明专利
摘要
本发明公开了一种基于水电噪音的语音自动识别增强方法及系统,属于语音识别及处理技术领域,针对现有神经网络采用的固定形状的卷积核在处理声纹信息时会受到限制,进而影响语音增强性能的问题,采用基于跨维度协同注意力机制和可形变卷积的端到端编‑解码器网络CADNet进行语音增强,在CADNet中通过通道维度自适应映射得到一维卷积内核大小,即通道交互的覆盖范围,保证了语音增强的效率和有效性,同时节约了计算资源。此外,本发明在语音增强和语音识别阶段均采用了注意力机制,注意力机制会关注模型的重要特征并抑制那些不重要的特征,从而提升模型的表示能力,进而提高语音增强和识别的效果。
技术关键词
语音自动识别 水电 双向长短期记忆网络 sigmoid函数 灯泡贯流式水轮发电机组 协同注意力 语音识别网络 网络单元 内核 输出特征 融合特征 双曲正切函数 全局平均池化 信息编码 语音识别模块 通道 机制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号