一种利用智能眼镜语音辅助盲人日常生活的方法

正文

推荐专利

申请号：CN202410871084

申请日期：2024-07-01

公开号：CN118781361A

公开日期：2024-10-15

类型：发明专利

摘要

本发明属于人工智能技术领域，具体涉及一种利用智能眼镜语音辅助盲人日常生活的方法，包括有以下步骤：步骤S100：图像特征提取；步骤S200：文本特征提取；步骤S300：多模态特征融合；步骤S400：文本生成；步骤S500：文本转语音：将所得到的文本序列通过语音输出；本发明的技术方案，能够在智能眼镜采集周围环境图像后，通过语音播报的方式，提示盲人具体方位下的环境、物体信息，可应用于包括物体识别、路径指引、交通信号识别、商品信息获取等方面，通过这些功能，失明人群可以更自主地进行日常活动，不仅能够显著提升失明人群的生活质量，还能够促进他们更好地融入社会，增强他们的自信心和独立性。

技术关键词

图像特征向量文本特征向量辅助盲人智能眼镜训练特征提取模型语音日常生活 BERT模型多模态特征融合序列图像特征提取注意力机制解码器采集周围环境全局平均池化韵律预测

系统为您推荐了相关专利信息

一种基于AR智能眼镜的故障处理辅助方法及系统

AR智能眼镜风险实时数据 SLAM技术机器学习模型

聚类结果的解释文本生成方法、装置、设备及存储介质

文本特征向量文本生成方法聚类大语言模型文本生成装置

一种基于多模态数据的数据中心建筑信息模型（BIM）动态耦合生成方法

像素点残差模块解码器建筑信息模型图像特征编码

文生图模型、模型训练、图像生成方法、装置及电子设备

文本特征向量文本编码器图像特征向量绘画风格

一种基于多模态大模型的国际传播受众反馈讽刺检测方法

图片相似性度量函数文本特征向量多模态数据

一种利用智能眼镜语音辅助盲人日常生活的方法

站点导航

APP 下载