一种基于多模态与预训练模型的视觉语义栅格地图构建法

正文

推荐专利

申请号：CN202411831794

申请日期：2024-12-12

公开号：CN119963752A

公开日期：2025-05-09

类型：发明专利

摘要

本发明公开了一种基于多模态与预训练模型的视觉语义栅格地图构建法，包括以下步骤：采集数据；利用预训练模型获取语义图像；获取全局和局部三维坐标及其对应的色彩及语义信息；构建栅格地图。本发明充分融合多模态数据，利用RGB‑D相机的深度图像、彩色图像及相机位姿信息，融入语义信息，让地图兼具空间布局、视觉及语义特征，提升机器人对环境的理解，增强地图在不同场景下的实用性与适配性。本发明为地图中的每个点赋予语义信息，可使机器人更好地理解环境，实现与人类更自然的交互，提高地图构建的实用性和易接受性。

技术关键词

栅格地图构建彩色图像相机矩阵坐标系多模态像素制图系统语义分割模型视觉构建栅格地图色彩预训练模型融入语义信息字典机器人对环境

系统为您推荐了相关专利信息

一种机器人定位方法及系统

机器人定位方法特征地图特征分布信息坐标系采样点

差速机器人自适应路线追踪的速度控制方法及系统

速度控制方法速度控制系统加速度机器人位姿矩阵

一种安全正交跳频图案构造方法

跳频图案密码算法序列映射算法元素

一种基于大语言模型的蜂窝用户App使用数据合成方法

大语言模型数据序列生成方式文本编码方法

一种用于车内声场重建的驾乘人员耳侧位置定位及追踪方法

车内声场面部特征追踪方法相机对象

一种基于多模态与预训练模型的视觉语义栅格地图构建法

站点导航

APP 下载