智能眼镜的语音识别方法、智能眼镜及存储介质

正文

推荐专利

申请号：CN202510347905

申请日期：2025-03-24

公开号：CN120388562A

公开日期：2025-07-29

类型：发明专利

摘要

本申请涉及语音识别技术，公开了一种智能眼镜的语音识别方法、智能眼镜及存储介质，包括：在智能眼镜运行过程中，实时采集语音信号；基于预训练的人工智能模型的输入层，对语音信号进行多尺度特征提取，并在特征提取过程中引入注意力机制学习不同特征的重要性权重，以对关键特征进行加权增强；将加权增强后的多尺度特征进行深度融合，并在特征融合后进行非线性激活和序列建模；将中间层输出的特征向量转换为语音识别结果；智能眼镜基于当前的执行任务，根据语音识别结果执行相应的操作。本申请还公开一种控制装置。本申请旨在提高智能眼镜对语音识别的准确率。

技术关键词

智能眼镜语音识别方法人工智能模型引入注意力机制多尺度特征提取中间层语音识别模块 Softmax函数生成语音执行语音识别局部特征提取语音识别技术信号非线性可读存储介质模型压缩麦克风处理器滤波算法

系统为您推荐了相关专利信息

直通状态实时大数据判断方法

红绿灯路口路段汽车判断方法亮灯

一种基于剩余寿命预测及深度强化学习的飞机发动机维修决策方法

航空发动机维修飞机发动机维修深度强化学习决策方法性能退化数据

基于人工智能模型的多媒体会议数据处理方法及相关装置

人工智能模型图像会议纪要多媒体文本

一种基于人工智能的干旱风险预测方法及计算机可读介质

风险预测方法组合情景长短期记忆网络 Copula函数陆地

多模态语音识别方法、装置、设备及计算机可读介质

声学特征唇形特征语音识别模型注意力编码器语音编码

智能眼镜的语音识别方法、智能眼镜及存储介质

站点导航

APP 下载