摘要
本发明公开了一种基于DINOv2的寄存器辅助聚合视觉位置识别方法,包括以下步骤:步骤1、收集数据集中的街景图像,组成训练样本和测试样本,并预处理所述训练样本和所述测试样本;步骤2、根据DINOv2网络构建包含多尺度特征融合模块的神经网络;将预处理后的训练样本放入初始模型,并经过所述神经网络获得多尺度特征,同时得到局部描述符;步骤3、训练所述神经网络,优化所述神经网络参数,得到训练后的模型;步骤4、将所述测试样本中的测试图像输入所述训练后的模型,得到与所述测试样本匹配的验证图像,并输出召回率。本发明增强了不同分辨率下特征的表示能力,提高了全局描述符的鲁棒性,提高了位置检索的准确度。
技术关键词
视觉位置识别方法
描述符
多尺度特征融合
多层感知器
神经网络参数
计算机程序指令
样本
归一化方法
街景
图像
多层特征融合
注意力机制
令牌
双线性插值法
聚类特征
计算机程序产品