基于视觉语言模型隐空间表征的自省式终身SLAM方法及系统

正文

推荐专利

申请号：CN202510687988

申请日期：2025-05-27

公开号：CN120599495A

公开日期：2025-09-05

类型：发明专利

摘要

本发明涉及一种基于视觉语言模型隐空间表征的自省式终身SLAM方法及系统，方法包括：基于RGB‑D图像利用语义编码器提取语义标签，并基于RGB‑D图像和语义标签生成场景地图和语义拓扑图；基于场景地图生成动态掩膜，获取动态掩膜覆盖率并基于覆盖率筛选高静态置信度值的关键帧；实时计算关键帧对应的相机位姿估计，通过对关键帧进行采样实现关键帧分层，并利用NeRF模型进行分层渲染得到虚拟视图；计算虚拟视图与对应真实图像的隐空间差异度，基于隐空间差异度判定是否需要进行误差自省，系统用于实现上述的方法。与现有技术相比，本发明实现了将VLM的开放语义推理、NeRF的高精度重建与SLAM的实时定位相结合，提高了定位与建图的准确。

技术关键词

SLAM方法动态掩膜关键帧语义标签生成场景相机位姿估计覆盖率图像拓扑图地图视觉编码分层网格移动平均滤波交叉注意力机制

系统为您推荐了相关专利信息

一种零碳能枢纽的多场景容量优化配置方法及相关设备

容量优化配置方法混合整数规划模型生成场景可再生能源装置风力涡轮机

一种物体级语义重定位方法、装置、终端及存储介质

定位地图关键帧重定位方法特征点图像

一种微表情实时情绪研判方法及系统

研判方法表情特征提取研判系统多模态面部微表情

一种稀疏视点下基于点云增密和多模态协同优化的新视点生成方法

视点生成方法生成稀疏点云运动恢复结构生成高密度单目深度模型

一种文本生成方法、系统、终端设备及存储介质

手势运动轨迹动作意图识别文本生成方法图像序列数据运动意图识别

基于视觉语言模型隐空间表征的自省式终身SLAM方法及系统

站点导航

APP 下载