一种基于视觉语言模型的AR导航系统及方法

正文

推荐专利

申请号：CN202510831107

申请日期：2025-06-20

公开号：CN120744017A

公开日期：2025-10-03

类型：发明专利

摘要

本发明公开了一种基于视觉语言模型的AR导航系统及方法，该方法首先进行视频数据采集，并构建记忆数据库。其次在构建的记忆数据库中查询与用户自然语言请求最相关的导航目标，得到的当前AR设备位姿和目标位姿。然后利用当前AR设备位姿和目标位姿，根据点云地图，求解从当前位姿到目标位姿的最短路径，并优化路径方向，最终得到优化路径。最后利用优化路径，在AR设备中，通过视野叠加路径指示和语音提示，引导用户沿规划路径移动，并更新点云地图和记忆数据库。本发明能够仅凭摄像头输入在GPS精度不高的室内外等复杂环境中实现高精度实时定位与稀疏点云地图构建，进行准确导航，提升导航的灵活性与智能化水平。

技术关键词

AR设备点云地图导航方法语义视觉大语言模型时空注意力机制记忆模型自然语言 OCR文字识别技术注意力参数估计设备位置网络架构导航系统异构融合架构符号检索算法

系统为您推荐了相关专利信息

占有网络预测方法、装置、设备、存储介质及产品

融合特征图像特征数据融合策略金字塔模型采样点

一种基于多感官聚焦与神经重塑的状态调节系统

多模态生理调节系统感官数据交互模块多模态特征

一种消防设备的异常溯源方法及系统

消防设备节点溯源方法溯源数据构建知识图谱

仿生服务型人形机器人眼部结构

人形机器人信号处理单元活动组件图形处理单元视觉传感器

洗碗机的自动清洗方法、装置及存储介质

洗碗机声音传感器视觉传感器自动清洗方法声音检测信息

一种基于视觉语言模型的AR导航系统及方法

站点导航

APP 下载