摘要
本发明涉及一种基于视觉语言模型隐空间表征的自省式终身SLAM方法及系统,方法包括:基于RGB‑D图像利用语义编码器提取语义标签,并基于RGB‑D图像和语义标签生成场景地图和语义拓扑图;基于场景地图生成动态掩膜,获取动态掩膜覆盖率并基于覆盖率筛选高静态置信度值的关键帧;实时计算关键帧对应的相机位姿估计,通过对关键帧进行采样实现关键帧分层,并利用NeRF模型进行分层渲染得到虚拟视图;计算虚拟视图与对应真实图像的隐空间差异度,基于隐空间差异度判定是否需要进行误差自省,系统用于实现上述的方法。与现有技术相比,本发明实现了将VLM的开放语义推理、NeRF的高精度重建与SLAM的实时定位相结合,提高了定位与建图的准确。
技术关键词
SLAM方法
动态掩膜
关键帧
语义标签
生成场景
相机位姿估计
覆盖率
图像
拓扑图
地图
视觉
编码
分层
网格
移动平均滤波
交叉注意力机制
系统为您推荐了相关专利信息
容量优化配置方法
混合整数规划模型
生成场景
可再生能源装置
风力涡轮机
研判方法
表情特征提取
研判系统
多模态
面部微表情
视点生成方法
生成稀疏点云
运动恢复结构
生成高密度
单目深度模型
手势运动轨迹
动作意图识别
文本生成方法
图像序列数据
运动意图识别