摘要
本发明提出了一种基于四元组损失网络的视觉地点识别模型构建方法及系统,涉及机器人和计算机视觉技术领域,针对的问题是:传统视觉识别技术在环境条件因素变化、视角变化等场景下无法保持鲁棒性,模型识别准确性差。通过四元金字塔编码器,得到全局特征描述符,将全局描述符输入至哈希编码器生成全局哈希码;基于全局哈希码对四元损失网络进行训练;采用贝叶斯四元损失网络进行概率估计,构建的最大似然函数提取候选地点。通过多通道注意力机制和掩码特征融合,增强地点识别模型的多尺度特征表达能力,引入四元损失函数提高模型的泛化性能和匹配准确性,解决了传统视觉识别技术在环境条件因素变化、视角变化等场景下鲁棒性和准确性差的问题。
技术关键词
识别模型构建方法
金字塔
特征描述符
编码器
注意力
地点
视觉识别技术
网络
图像
模型构建系统
计算机视觉技术
生成多尺度
重构
处理器
多尺度特征
计算机装置
特征提取模块
鲁棒性