摘要
本发明公开了一种面向盲人导航的复杂环境识别与智能交互系统,旨在为盲人或视障人士提供更安全、人性化的出行辅助。基于地图软件规划的出行路线,采用添加了CBAM注意力机制的YOLOv8目标检测算法结合视觉大模型进行复杂场景识别,并将识别结果传输给大语言模型。大语言模型根据识别结果生成主动警示文本或回答用户提问,并以语音形式反馈给用户,实现智能交互。同时依托单目视觉技术和自相关分析算法计算的平均步长,将播报单位从“米”转换为“步”,提升语音播报的人性化。本发明通过结合前后端信息传输,引入复杂环境识别、语音交互及人性化指引技术,显著提升了盲人导航辅助的安全性、交互性和用户体验。
技术关键词
智能交互系统
客户端设备
面向盲人
加速度
单目视觉技术
坐标系
注意力机制
后台服务器
周期
导航模块
图像
算法
计步器
相机光轴
大语言模型
物体
语音
多尺度特征融合
标签
系统为您推荐了相关专利信息
数据收集模块
数据分析模块
高精度加速度计
海洋
光纤陀螺仪
机器学习模型
平衡装置
直线电机
弹簧
电机平衡技术
LSTM神经网络
当量摩擦系数
故障诊断方法
钢丝绳
故障诊断模型
智能车载终端
车辆加速度数据
交通事故检测
时序特征
卷积神经网络模型