一种基于多模态与预训练模型的视觉语义栅格地图构建法

AITNT
正文
推荐专利
一种基于多模态与预训练模型的视觉语义栅格地图构建法
申请号:CN202411831794
申请日期:2024-12-12
公开号:CN119963752A
公开日期:2025-05-09
类型:发明专利
摘要
本发明公开了一种基于多模态与预训练模型的视觉语义栅格地图构建法,包括以下步骤:采集数据;利用预训练模型获取语义图像;获取全局和局部三维坐标及其对应的色彩及语义信息;构建栅格地图。本发明充分融合多模态数据,利用RGB‑D相机的深度图像、彩色图像及相机位姿信息,融入语义信息,让地图兼具空间布局、视觉及语义特征,提升机器人对环境的理解,增强地图在不同场景下的实用性与适配性。本发明为地图中的每个点赋予语义信息,可使机器人更好地理解环境,实现与人类更自然的交互,提高地图构建的实用性和易接受性。
技术关键词
栅格地图构建 彩色图像 相机 矩阵 坐标系 多模态 像素 制图系统 语义分割模型 视觉 构建栅格地图 色彩 预训练模型 融入语义信息 字典 机器人对环境
系统为您推荐了相关专利信息
1
一种机器人定位方法及系统
机器人定位方法 特征地图 特征分布信息 坐标系 采样点
2
差速机器人自适应路线追踪的速度控制方法及系统
速度控制方法 速度控制系统 加速度 机器人位姿 矩阵
3
一种安全正交跳频图案构造方法
跳频图案 密码算法 序列 映射算法 元素
4
一种基于大语言模型的蜂窝用户App使用数据合成方法
大语言模型 数据 序列 生成方式 文本编码方法
5
一种用于车内声场重建的驾乘人员耳侧位置定位及追踪方法
车内声场 面部特征 追踪方法 相机 对象
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号