摘要
本申请涉及语音识别技术,公开了一种智能眼镜的语音识别方法、智能眼镜及存储介质,包括:在智能眼镜运行过程中,实时采集语音信号;基于预训练的人工智能模型的输入层,对语音信号进行多尺度特征提取,并在特征提取过程中引入注意力机制学习不同特征的重要性权重,以对关键特征进行加权增强;将加权增强后的多尺度特征进行深度融合,并在特征融合后进行非线性激活和序列建模;将中间层输出的特征向量转换为语音识别结果;智能眼镜基于当前的执行任务,根据语音识别结果执行相应的操作。本申请还公开一种控制装置。本申请旨在提高智能眼镜对语音识别的准确率。
技术关键词
智能眼镜
语音识别方法
人工智能模型
引入注意力机制
多尺度特征提取
中间层
语音识别模块
Softmax函数
生成语音
执行语音识别
局部特征提取
语音识别技术
信号
非线性
可读存储介质
模型压缩
麦克风
处理器
滤波算法
系统为您推荐了相关专利信息
航空发动机维修
飞机发动机维修
深度强化学习
决策方法
性能退化数据
风险预测方法
组合情景
长短期记忆网络
Copula函数
陆地
声学特征
唇形特征
语音识别模型
注意力编码器
语音编码