摘要
本发明涉及语音识别技术领域,具体公开了一种基于气骨导双模的深度学习关键词识别方法。首先构建双模态数据集,通过同步采集纯净气导/骨导语音,并向气导语音添加环境噪声形成带噪气导信号,按比例划分训练集、验证集和测试集;其次设计Audiomer‑L神经网络模型,其包括学习向量模块通过在输入序列首部添加可学习向量,聚合分类特征信息;一系列卷积注意力模块采用带压缩激励机制的一维卷积与Performer注意力模块,通过预查询张量和上下文张量实现时序特征强化;最终通过多层感知器MLP模块完成分类决策。本发明采用固定长度分帧处理,通过端到端训练策略,在噪声环境下相比单模态系统显著提升识别准确率,适用于可穿戴设备、助听器等复杂声学场景的语音交互应用。
技术关键词
关键词识别方法
神经网络模型
注意力
卷积模块
多层感知器
分类特征
训练集
语音识别技术
声学场景
时序特征
数据
波形
音频
穿戴设备
双模态
助听器
处理单元
系统为您推荐了相关专利信息
语义
大语言模型
神经网络模型
计算机程序产品
处理器
热带气旋强度
卫星云图
深度卷积神经网络
强度预测方法
因子
机械臂控制方法
特征提取模型
图像
机械臂控制装置
数据
岩性填图方法
反射率数据
深度学习神经网络模型
模糊C均值
特征提取网络