一种基于共享视觉骨干网络的细粒度图像识别方法及系统

正文

推荐专利

申请号：CN202511178841

申请日期：2025-08-22

公开号：CN120689686A

公开日期：2025-09-23

类型：发明专利

摘要

本发明涉及图像识别分类技术领域，尤其是涉及一种基于共享视觉骨干网络的细粒度图像识别方法及系统。方法包括获取细粒度图像数据集；对获取的图像数据进行预处理；构建深度网络模型，其中包括，利用深度网络模型进行特征提取；对提取的特征图进行对象提议与筛选；对筛选后的特征进行特征池化和信息融合；对融合后的特征进行全局摘要提取和门控上下文融合；将门控融合后的特征中的对象序列投影到语言模型的特征空间；对构建的深度网络模型进行训练和优化；利用优化后的模型进行细粒度图像分类。本发明通过引入一个并行的局部特征提取路径，并设计了一个跨注意力融合模块，使得模型能够同时感知图像的全局上下文与局部判别性细节。

技术关键词

深度网络模型细粒度图像分类对象序列图像识别分类技术摘要注意力生成结构化数据多层感知机视觉特征令牌图像识别系统局部特征提取解码器生成数据集

一种基于共享视觉骨干网络的细粒度图像识别方法及系统

站点导航

APP 下载