一种域不变信息挖掘的视觉场景识别方法

正文

推荐专利

一种域不变信息挖掘的视觉场景识别方法

申请号：CN202411054021

申请日期：2024-08-02

公开号：CN119131719A

公开日期：2024-12-13

类型：发明专利

摘要

本发明涉及机器人自主导航与视觉识别技术领域，公开了一种域不变信息挖掘的视觉场景识别方法，采用主干网络VGG‑DIMM、聚合头NetVLAD两部分组成DIMNet模型实现，包括下述步骤：对于给定的输入图像，利用VGG‑DIMM初步提取其局部特征描述符；以VGG‑DIMM提取得到的局部特征描述符作为输入，使用原始的NetVLAD将局部特征描述符聚合成一维的全局特征描述符F(I)；通过相似度算法，将查询图像的全局特征描述符F(I)与所有数据库图像的全局特征描述符F(I)进行一一比较，从而找出所有和查询图像归属同一场景的数据库图像；通过所采用的域不变信息挖掘模块(DIMM)在级联的卷积单元组中，纳入特征图不同空间区域间的相互依赖关系，达到DIMNet模型对域不变的静态类物体的关注度增强的目的。

技术关键词

视觉场景识别方法局部特征描述符局部感受野注意力图像滑动窗口机器人自主导航视觉识别技术网络强鲁棒性表达式空间结构级联算法模块索引通道

一种域不变信息挖掘的视觉场景识别方法

站点导航

APP 下载