摘要
本发明涉及图像识别分类技术领域,尤其是涉及一种基于共享视觉骨干网络的细粒度图像识别方法及系统。方法包括获取细粒度图像数据集;对获取的图像数据进行预处理;构建深度网络模型,其中包括,利用深度网络模型进行特征提取;对提取的特征图进行对象提议与筛选;对筛选后的特征进行特征池化和信息融合;对融合后的特征进行全局摘要提取和门控上下文融合;将门控融合后的特征中的对象序列投影到语言模型的特征空间;对构建的深度网络模型进行训练和优化;利用优化后的模型进行细粒度图像分类。本发明通过引入一个并行的局部特征提取路径,并设计了一个跨注意力融合模块,使得模型能够同时感知图像的全局上下文与局部判别性细节。
技术关键词
深度网络模型
细粒度图像分类
对象
序列
图像识别分类技术
摘要
注意力
生成结构化数据
多层感知机
视觉特征
令牌
图像识别系统
局部特征提取
解码器
生成数据集