一种基于视觉语义和地图集成的零样本连续视觉语言导航方法

正文

推荐专利

申请号：CN202510499754

申请日期：2025-04-21

公开号：CN120403600B

公开日期：2025-11-25

类型：发明专利

摘要

本发明公开一种基于视觉语义和地图集成的零样本连续视觉语言导航方法，包括以下步骤：S1.接受当前导航任务的自然语言指令，并通过文本编码器对其进行编码和特征提取，以获得指令特征；S2.捕获执行任务时的RGB视图，对RGB视图中的环境知识进行解耦，获得环境解耦知识；S3.捕获执行任务时的Depth视图，结合RGB视图以及指令特征，通过跨模态注意力网络获得自我中心的语义地图；S4.结合语义地图以及指令特征，根据航点生成网络生成一系列通向目标的可导航航点；S5.利用这些可导航航点以及环境解耦知识，预测导航智能体当前的导航动作；S6.重复上述步骤，直至导航任务完成或达到最大移动步数。

技术关键词

语义地图导航方法网格地图视觉规划决策模块物体文本编码器指令样本 BERT模型自然语言跨模态矩阵注意力机制网络精确地识别

系统为您推荐了相关专利信息

医疗机器人移动平台定位方法、融合地图构建方法

SLAM地图移动平台定位方法地图构建方法扩展卡尔曼滤波算法医疗机器人

一种基于忆阻阵列蚁群算法的图像边缘检测方法

图像边缘检测方法蚁群算法蚂蚁像素点忆阻器模型

一种基于AIGC课堂行为反馈教学系统

教学系统视频采集单元三维虚拟形象深度学习训练识别模块

一种基于大模型能力的通用安全风险监测方法和系统

风险监测方法图像场景识别场景类别图像识别模型标签文本

一种输电线锤式破冰器

破冰器驱动轮除冰系统破冰机器人线槽

一种基于视觉语义和地图集成的零样本连续视觉语言导航方法

站点导航

APP 下载