摘要
本发明涉及机器人自主导航与视觉识别技术领域,公开了一种域不变信息挖掘的视觉场景识别方法,采用主干网络VGG‑DIMM、聚合头NetVLAD两部分组成DIMNet模型实现,包括下述步骤:对于给定的输入图像,利用VGG‑DIMM初步提取其局部特征描述符;以VGG‑DIMM提取得到的局部特征描述符作为输入,使用原始的NetVLAD将局部特征描述符聚合成一维的全局特征描述符F(I);通过相似度算法,将查询图像的全局特征描述符F(I)与所有数据库图像的全局特征描述符F(I)进行一一比较,从而找出所有和查询图像归属同一场景的数据库图像;通过所采用的域不变信息挖掘模块(DIMM)在级联的卷积单元组中,纳入特征图不同空间区域间的相互依赖关系,达到DIMNet模型对域不变的静态类物体的关注度增强的目的。
技术关键词
视觉场景识别方法
局部特征描述符
局部感受野
注意力
图像
滑动窗口
机器人自主导航
视觉识别技术
网络
强鲁棒性
表达式
空间结构
级联
算法
模块
索引
通道