基于多尺度全局卷积网络的语音关键词识别方法及系统

AITNT
正文
推荐专利
基于多尺度全局卷积网络的语音关键词识别方法及系统
申请号:CN202411582293
申请日期:2024-11-07
公开号:CN119400162A
公开日期:2025-02-07
类型:发明专利
摘要
本发明公开了基于多尺度全局卷积网络的语音关键词识别方法及系统,涉及语音识别技术领域,包括以下步骤:通过预卷积块对语音信息进行预处理获得初步语音特征;在多尺度特征融合残差模块中,处理初步语音特征同时降低不相关信息对语音特征的干扰;在最终卷积块中,对多尺度特征融合残差模块输出的语音特征进行处理获得最终语音特征;所述最终语音特征经过最大池化层和全连接层后,得到关键词识别结果。本发明中分别在时域与频域中提取更深层次的语音信息,避免不同领域信息之间可能存在的相互干扰;时域全局卷积和频域全局卷积可分别在时域和频域中捕捉语音信息的全局特征,增强模型的全局特征感知能力以学习更丰富的特征表示。
技术关键词
语音特征 残差模块 输出特征 多尺度特征融合 网络 代表 通道 语音关键词 卷积滤波器 语音识别技术 特征值 识别系统 处理器 元素 识别模块
系统为您推荐了相关专利信息
1
一种基于多尺度通道与上下文引导聚合的人员违规行为检测方法
YOLO模型 通道 检测头 融合特征 局部细节特征
2
一种基于多维雷达电磁散射特征序列的昆虫种类辨识方法
散射特征 雷达散射截面 识别神经网络 辨识方法 电磁
3
车辆网络入侵响应方法、设备及计算机可读存储介质
入侵响应方法 威胁情报库 车辆网络安全 入侵检测模型 可读存储介质
4
一种基于改进yolov5的多类散乱堆叠零件的识别方法
零件检测方法 检测网络模型 旋转框 引入注意力机制 识别发动机
5
一种智能合约漏洞检测方法、装置、设备及存储介质
节点特征 抽象语法树 多头注意力机制 多尺度特征 GCN模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号