基于视觉语言模型隐空间表征的自省式终身SLAM方法及系统

AITNT
正文
推荐专利
基于视觉语言模型隐空间表征的自省式终身SLAM方法及系统
申请号:CN202510687988
申请日期:2025-05-27
公开号:CN120599495A
公开日期:2025-09-05
类型:发明专利
摘要
本发明涉及一种基于视觉语言模型隐空间表征的自省式终身SLAM方法及系统,方法包括:基于RGB‑D图像利用语义编码器提取语义标签,并基于RGB‑D图像和语义标签生成场景地图和语义拓扑图;基于场景地图生成动态掩膜,获取动态掩膜覆盖率并基于覆盖率筛选高静态置信度值的关键帧;实时计算关键帧对应的相机位姿估计,通过对关键帧进行采样实现关键帧分层,并利用NeRF模型进行分层渲染得到虚拟视图;计算虚拟视图与对应真实图像的隐空间差异度,基于隐空间差异度判定是否需要进行误差自省,系统用于实现上述的方法。与现有技术相比,本发明实现了将VLM的开放语义推理、NeRF的高精度重建与SLAM的实时定位相结合,提高了定位与建图的准确。
技术关键词
SLAM方法 动态掩膜 关键帧 语义标签 生成场景 相机位姿估计 覆盖率 图像 拓扑图 地图 视觉 编码 分层 网格 移动平均滤波 交叉注意力机制
系统为您推荐了相关专利信息
1
一种零碳能枢纽的多场景容量优化配置方法及相关设备
容量优化配置方法 混合整数规划模型 生成场景 可再生能源装置 风力涡轮机
2
一种物体级语义重定位方法、装置、终端及存储介质
定位地图 关键帧 重定位方法 特征点 图像
3
一种微表情实时情绪研判方法及系统
研判方法 表情特征提取 研判系统 多模态 面部微表情
4
一种稀疏视点下基于点云增密和多模态协同优化的新视点生成方法
视点生成方法 生成稀疏点云 运动恢复结构 生成高密度 单目深度模型
5
一种文本生成方法、系统、终端设备及存储介质
手势运动轨迹 动作意图识别 文本生成方法 图像序列数据 运动意图识别
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号