基于单目相机和语言指令的视觉语言导航方法及系统

正文

推荐专利

申请号：CN202510535760

申请日期：2025-04-27

公开号：CN120445205A

公开日期：2025-08-08

类型：发明专利

摘要

本发明公开了基于单目相机和语言指令的视觉语言导航方法及系统，方法包括：S1、特征场构建，利用单目RGB‑D摄像头获取的视觉信息，采用3DGS构建3DGS特征场；S2、隐式部分补全，通过上下文特征关系推断缺失区域的表示，以生成完整的特征图；S3、路径点预测，基于3DGS特征场，生成鸟瞰图特征图，并通过路径点预测器预测附近的可导航路径点；S4、基于不确定性的主动感知，当机器人对导航决策不确定时，通过旋转摄像头来获取更多视觉信息并补充缺失的视觉信息；S5、基于构建的全景特征图和预测的路径点，构建拓扑地图，并结合语言指令，利用全景视觉语言导航规划模型进行导航决策。本发明有效解决了单目视觉信息不完整的问题，显著提升导航的成功率和效率。

技术关键词

单目相机单目视觉信息导航方法拓扑地图非极大值抑制方法机器人决策导航系统上下文特征生成点云数据指令散射特征透明度坐标系模块热力图规划视角

基于单目相机和语言指令的视觉语言导航方法及系统

站点导航

APP 下载