摘要
本发明涉及一种基于跨模态本体协同主动感知的复杂指令驱动导航方法,主要包括:在导航过程中构建实时动态积累的全局网格地图,并构建局部主动感知语义地图;针对局部感知语义地图中的三维点进行分类,并基于分类结果筛选得到候选点;将复杂指令拆解为多个子任务并进行编码,之后与候选点的特征进行时空对齐处理,计算不同候选点与各子任务之间的相关性,确定出候选点的多模态特征;将候选点的多模态特征以及全局网格地图特征输入Transformer模型,通过注意力机制得到候选点的逻辑值集合、确定出最佳候选点。与现有技术相比,本发明能够在未知环境中完成多步骤、模糊的指令的导航任务,解决以往方法在新环境中的泛化能力不足以及对模糊指令处理的局限性。
技术关键词
导航方法
语义地图
跨模态
网格地图
坐标系
指令
模态特征
网格特征
图像
全局地图
节点
相机
深度图
坐标转换系统
仿真环境
交叉注意力机制
物体检测器
矩阵
BERT模型