一种基于深度学习的细粒度图像检索方法

正文

推荐专利

一种基于深度学习的细粒度图像检索方法

申请号：CN202510086534

申请日期：2025-01-20

公开号：CN119988667A

公开日期：2025-05-13

类型：发明专利

摘要

本发明属于计算机视觉技术领域，涉及一种基于深度学习的细粒度图像检索方法，包括：获取待检索的图像数据；对图像数据进行预处理，将预处理后的图像输入到细粒度图像检索模型中，得到检索结果；其中细粒度图像检索模型包括ViT模型、Token筛选模块、中值增强空间通道注意力模块以及语义信息融合模块；ViT模型用于将图像划分为固定大小的patch序列；Token筛选模块模块用于对patch序列进行处理，得到高层语义特征表示；中值增强空间通道注意力模块用于对patch序列进行特征提取，得到中低层细节特征表示；语义信息融合模块用于对高层语义特征表示和中低层细节特征表示进行融合；本发明通过将ViT模型引入到图像检索任务中，并针对ViT模型中的token提出了独特的token增强选取方法，提升了模型对图像高层语义的表示能力。

技术关键词

高层语义特征图像检索模型模块输出特征序列融合特征多尺度特征 Sigmoid函数高层语义信息通道注意力机制多头注意力机制计算机视觉技术细粒度特征全局平均池化元素

系统为您推荐了相关专利信息

基于遥操作机器人任务的多模态数据特征提取与优化方法

数据特征提取彩色图像机器人操作系统机器人模仿学习多模态特征

一种路口通行决策方法、装置、设备及介质

车道中心线交通灯信息决策方法车道线信息显示状态控制

一种铁路风吹雪实时监测系统

实时监测系统神经网络模型实时监测方法数据分析模块节点数

一种针对电网调频需求的空调响应能力评估方法和装置

中央空调能力评估模型电网调频需求能力评估方法能力评估装置

配电网的多场景评估方法、装置、设备及存储介质

低压配网线路场景评估方法负荷多场景有功功率

一种基于深度学习的细粒度图像检索方法

站点导航

APP 下载