基于多模态大语言模型的智能导盲眼镜系统

正文

推荐专利

基于多模态大语言模型的智能导盲眼镜系统

申请号：CN202510177248

申请日期：2025-02-18

公开号：CN120131404A

公开日期：2025-06-13

类型：发明专利

摘要

本发明公开了一种基于多模态大语言模型的智能导盲眼镜系统，包括图像采集模块、语音采集模块、大语言模型模块、骨传导传声模块、导航路径规划模块、中央处理器模块以及无线通信模块；图像采集模块，用于获取前方场景的立体图像，提供三维空间信息；语音采集模块，用于采集用户的语音指令；大语言模型模块，根据用户的语音指令，利用大语言模型生成文字回答并转换成语音；骨传导传声模块，用于接收并播放大语言模型模块生成的语音；导航路径规划模块，用于根据用户位置和目的地规划导航路径；本发明为盲人提供了导航定位、线路指引、语音提示等功能，采用眼镜作为载体，方便携带，采用语音唤醒等指令替代按键，操作简单，实用性强。

技术关键词

智能导盲眼镜系统大语言模型中央处理器模块语音采集模块导航路径规划图像采集模块多模态电子地图骨传导蓝牙耳机短时傅里叶变换 GPS模块无线通信模块规划导航路径云服务接口 TTS系统音频处理单元三维空间信息采集周围环境

系统为您推荐了相关专利信息

一种大语言模型高效微调测评方法和系统

存储模块大语言模型测评系统信息管理功能基线

一种融合汝瓷知识图谱与微调控制的汝瓷图像生成方法

图像生成方法图谱图像生成模型大语言模型关键词

一种语义分析方法、装置、电子设备和存储介质

文本语义结构语义分析方法大语言模型语句

实时会议纪要优化系统

会议纪要大语言模型语音识别模块脑电波分析智能穿戴设备监测

基于大模型融合精细化场景图思维链的图像详细描述方法

对象图像场景大语言模型多模态

基于多模态大语言模型的智能导盲眼镜系统

站点导航

APP 下载