一种基于气骨导双模的深度学习关键词识别方法

正文

推荐专利

申请号：CN202510222640

申请日期：2025-02-26

公开号：CN120071907A

公开日期：2025-05-30

类型：发明专利

摘要

本发明涉及语音识别技术领域，具体公开了一种基于气骨导双模的深度学习关键词识别方法。首先构建双模态数据集，通过同步采集纯净气导/骨导语音，并向气导语音添加环境噪声形成带噪气导信号，按比例划分训练集、验证集和测试集；其次设计Audiomer‑L神经网络模型，其包括学习向量模块通过在输入序列首部添加可学习向量，聚合分类特征信息；一系列卷积注意力模块采用带压缩激励机制的一维卷积与Performer注意力模块，通过预查询张量和上下文张量实现时序特征强化；最终通过多层感知器MLP模块完成分类决策。本发明采用固定长度分帧处理，通过端到端训练策略，在噪声环境下相比单模态系统显著提升识别准确率，适用于可穿戴设备、助听器等复杂声学场景的语音交互应用。

技术关键词

关键词识别方法神经网络模型注意力卷积模块多层感知器分类特征训练集语音识别技术声学场景时序特征数据波形音频穿戴设备双模态助听器处理单元

系统为您推荐了相关专利信息

用于识别针对大语言模型的提示注入攻击的方法、模型及设备

语义大语言模型神经网络模型计算机程序产品处理器

一种气旋强度预测方法及装置

热带气旋强度卫星云图深度卷积神经网络强度预测方法因子

VR教学方法、装置和VR教学系统

标签 VR系统指令场景类别教学方法

车载机械臂控制方法、装置、设备、存储介质和程序产品

机械臂控制方法特征提取模型图像机械臂控制装置数据

一种结合聚类的高光谱遥感深度学习岩性填图方法

岩性填图方法反射率数据深度学习神经网络模型模糊C均值特征提取网络

一种基于气骨导双模的深度学习关键词识别方法

站点导航

APP 下载