基于多尺度全局卷积网络的语音关键词识别方法及系统

正文

推荐专利

申请号：CN202411582293

申请日期：2024-11-07

公开号：CN119400162A

公开日期：2025-02-07

类型：发明专利

摘要

本发明公开了基于多尺度全局卷积网络的语音关键词识别方法及系统，涉及语音识别技术领域，包括以下步骤：通过预卷积块对语音信息进行预处理获得初步语音特征；在多尺度特征融合残差模块中，处理初步语音特征同时降低不相关信息对语音特征的干扰；在最终卷积块中，对多尺度特征融合残差模块输出的语音特征进行处理获得最终语音特征；所述最终语音特征经过最大池化层和全连接层后，得到关键词识别结果。本发明中分别在时域与频域中提取更深层次的语音信息，避免不同领域信息之间可能存在的相互干扰；时域全局卷积和频域全局卷积可分别在时域和频域中捕捉语音信息的全局特征，增强模型的全局特征感知能力以学习更丰富的特征表示。

技术关键词

语音特征残差模块输出特征多尺度特征融合网络代表通道语音关键词卷积滤波器语音识别技术特征值识别系统处理器元素识别模块

系统为您推荐了相关专利信息

一种基于多尺度通道与上下文引导聚合的人员违规行为检测方法

YOLO模型通道检测头融合特征局部细节特征

一种基于多维雷达电磁散射特征序列的昆虫种类辨识方法

散射特征雷达散射截面识别神经网络辨识方法电磁

车辆网络入侵响应方法、设备及计算机可读存储介质

入侵响应方法威胁情报库车辆网络安全入侵检测模型可读存储介质

一种基于改进yolov5的多类散乱堆叠零件的识别方法

零件检测方法检测网络模型旋转框引入注意力机制识别发动机

一种智能合约漏洞检测方法、装置、设备及存储介质

节点特征抽象语法树多头注意力机制多尺度特征 GCN模型

基于多尺度全局卷积网络的语音关键词识别方法及系统

站点导航

APP 下载