摘要
本发明涉及视觉导航技术领域,提供一种导航模型训练方法、装置、电子设备及存储介质,该方法包括:将各样本图文对中的样本图像和样本文本信息分别输入导航模型中的视觉编码器和文本编码器,以提取样本图像特征和样本文本特征;将各样本图文对对应的样本图像特征和样本文本特征代入对比学习损失函数,在对比学习损失函数收敛时,完成对视觉编码器和文本编码器的预训练;基于预训练得到的视觉编码器和文本编码器训练所述导航模型。本发明训练方法训练得到的导航模型能够精准地判断当前视角下的图像是否符合文本信息描述的内容,从而准确地预测机器人下一步的航路点。
技术关键词
导航模型训练方法
样本
文本编码器
图文
图像拼接
阶段
非暂态计算机可读存储介质
视觉导航技术
预测机器人
模型训练装置
特征提取单元
电子设备
处理器
存储器
视角
数据
标签
坐标