摘要
本发明涉及多模态向量数据库的构建方法、导航方法、定位方法,针对现有方法的问题提出在不依赖传统的语义二维栅格地图的情况下,解决机器人在长时间建图过程中,基于预训练的视觉语言模型有效感知环境中随时间动态变化以及细粒度的环境特征并构建向量数据库,不局限于人工设置的具体语义类别,赋予机器人有效存储和查询长期记忆的能力。通过与用户的自然语言交互可以便捷回顾数据库中曾经观察到的内容,并定位所在空间坐标位置。在发生定位故障时,机器人可以根据环境观察结果查询坐标信息,从而实现机器人重定位,解决当前机器人在大型以人为中心的环境中重定位匹配率低,效率低等问题,结合环境语义信息,提高机器人的环境感知能力。
技术关键词
多模态
导航方法
文本
图像嵌入
视觉
影像
定位方法
计算机程序代码
语义
机器人
计算机设备
指令
大语言模型
栅格地图
定位故障
自然语言
处理器
可读存储介质