摘要
本发明提出了一种基于惯性测量单元特征融合的语音识别方法,包括以下步骤:将加速度计和陀螺仪的六轴数据合并成RGB特征图,得到加速度计和陀螺仪的时频特征图;通过多层的CNN分别获取高层特征;加速度计和陀螺仪的高层特征分别通过通道注意力模块增强,再通过空间注意力权重对加速度计和陀螺仪的特征进行相互校准;对空间注意力校准过后的特征使用门控融合模块进行特征融合,融合特征过FPN模块,进行多尺度融合,最后通过分类器模块分类和识别。本发明通过融合加速度计和陀螺仪的多轴数据,可互补信息扩展有效感知范围,共同还原声音特征,实现在超低采样率下对无线耳机佩戴者人声与耳机扬声器声音的识别。
技术关键词
语音识别方法
陀螺仪
Sigmoid函数
注意力
融合特征
多尺度
双线性插值方法
通道
耳机扬声器
校准特征
上采样
模块
分类器
处理器
无线耳机
批量
计算机设备
数据
采样率
系统为您推荐了相关专利信息
优化系统控制方法
循环水泵
冷端系统
汽轮机
注意力机制
孪生神经网络
人脸识别方法
人脸图片
口罩
注意力
风险预测方法
样本
矩阵
轻量化卷积神经网络
动态
情感识别网络模型
漫画制作方法
情感识别模型
生成语音
文本
井下设备
特征提取模型
故障诊断方法
记忆单元
分类器模型