摘要
本发明给出一种层次化多尺度特征融合的深度哈希图像检索方法。首先采用Nested Hierarchical Transformer作为主干特征提取网络,通过嵌套的局部自注意力机制和层次化特征聚合模块,同步捕获图像的全局上下文信息与局部细节特征;然后构建多尺度特征融合模块,利用多分支非等比扩张率的空洞卷积核并行提取不同感受野的视觉特征,并结合注意力自适应地加权重要特征,生成具有判别性的多尺度融合特征;最后设计混合损失函数,通过中心相似性损失优化类内特征紧凑性,结合量化损失约束哈希码离散化过程,实现高效且保持语义相似性的哈希编码生成。本发明以Transformer与多尺度特征融合的协同机制实现图像特征的充分表达,并通过端到端的深度哈希学习框架提升大规模图像检索的精度与效率。
技术关键词
多尺度特征融合
多尺度特征金字塔
多尺度特征提取
语义
图像块
空洞
大规模图像检索
训练集
深度哈希学习
全局信息整合
深度哈希网络
图像检索模型
模块
局部细节特征
混合损失函数
通道注意力机制