摘要
本发明公开了一种基于视觉语言模型的AR导航系统及方法,该方法首先进行视频数据采集,并构建记忆数据库。其次在构建的记忆数据库中查询与用户自然语言请求最相关的导航目标,得到的当前AR设备位姿和目标位姿。然后利用当前AR设备位姿和目标位姿,根据点云地图,求解从当前位姿到目标位姿的最短路径,并优化路径方向,最终得到优化路径。最后利用优化路径,在AR设备中,通过视野叠加路径指示和语音提示,引导用户沿规划路径移动,并更新点云地图和记忆数据库。本发明能够仅凭摄像头输入在GPS精度不高的室内外等复杂环境中实现高精度实时定位与稀疏点云地图构建,进行准确导航,提升导航的灵活性与智能化水平。
技术关键词
AR设备
点云地图
导航方法
语义
视觉
大语言模型
时空注意力机制
记忆模型
自然语言
OCR文字识别技术
注意力参数
估计设备位置
网络架构
导航系统
异构融合架构
符号
检索算法
系统为您推荐了相关专利信息
融合特征
图像特征数据
融合策略
金字塔模型
采样点
多模态生理
调节系统
感官
数据交互模块
多模态特征
人形机器人
信号处理单元
活动组件
图形处理单元
视觉传感器
洗碗机
声音传感器
视觉传感器
自动清洗方法
声音检测信息