摘要
本发明公开了基于多尺度全局卷积网络的语音关键词识别方法及系统,涉及语音识别技术领域,包括以下步骤:通过预卷积块对语音信息进行预处理获得初步语音特征;在多尺度特征融合残差模块中,处理初步语音特征同时降低不相关信息对语音特征的干扰;在最终卷积块中,对多尺度特征融合残差模块输出的语音特征进行处理获得最终语音特征;所述最终语音特征经过最大池化层和全连接层后,得到关键词识别结果。本发明中分别在时域与频域中提取更深层次的语音信息,避免不同领域信息之间可能存在的相互干扰;时域全局卷积和频域全局卷积可分别在时域和频域中捕捉语音信息的全局特征,增强模型的全局特征感知能力以学习更丰富的特征表示。
技术关键词
语音特征
残差模块
输出特征
多尺度特征融合
网络
代表
通道
语音关键词
卷积滤波器
语音识别技术
特征值
识别系统
处理器
元素
识别模块
系统为您推荐了相关专利信息
YOLO模型
通道
检测头
融合特征
局部细节特征
散射特征
雷达散射截面
识别神经网络
辨识方法
电磁
入侵响应方法
威胁情报库
车辆网络安全
入侵检测模型
可读存储介质
零件检测方法
检测网络模型
旋转框
引入注意力机制
识别发动机
节点特征
抽象语法树
多头注意力机制
多尺度特征
GCN模型