摘要
本发明公开了一种基于多模态大语言模型的智能导盲眼镜系统,包括图像采集模块、语音采集模块、大语言模型模块、骨传导传声模块、导航路径规划模块、中央处理器模块以及无线通信模块;图像采集模块,用于获取前方场景的立体图像,提供三维空间信息;语音采集模块,用于采集用户的语音指令;大语言模型模块,根据用户的语音指令,利用大语言模型生成文字回答并转换成语音;骨传导传声模块,用于接收并播放大语言模型模块生成的语音;导航路径规划模块,用于根据用户位置和目的地规划导航路径;本发明为盲人提供了导航定位、线路指引、语音提示等功能,采用眼镜作为载体,方便携带,采用语音唤醒等指令替代按键,操作简单,实用性强。
技术关键词
智能导盲眼镜系统
大语言模型
中央处理器模块
语音采集模块
导航路径规划
图像采集模块
多模态
电子地图
骨传导蓝牙耳机
短时傅里叶变换
GPS模块
无线通信模块
规划导航路径
云服务接口
TTS系统
音频处理单元
三维空间信息
采集周围环境
系统为您推荐了相关专利信息
存储模块
大语言模型
测评系统
信息管理功能
基线
图像生成方法
图谱
图像生成模型
大语言模型
关键词
会议纪要
大语言模型
语音识别模块
脑电波分析
智能穿戴设备监测