摘要
本发明公开了一种用于大规模细粒度图像检索的属性感知哈希编码方法,包括以下步骤:通过卷积神经网络提取出多尺度的图像特征,并采用上采样策略对不同尺度的特征进行融合。使用一个由自注意力机制和前向网络构成的特征挖掘模块挖掘图像中具有显著区分性的特征。针对提取到的特征,使用一组可学习的查询与特征进行交互,直接解耦出一组可区分不同类别图像的特定视觉属性特征。每个查询捕获到的特定视觉属性特征会被压缩作为哈希编码的一位比特。此外,在训练过程中采用额外的辅助分支使得训练过程可以有效缓解低比特哈希编码场景下存在的优化困难问题,实现更好地优化可学习的查询,提高哈希编码的检索表现。本发明通过设置一组可学习的查询从复杂的全局图像特征中有效捕获出显著可区分的视觉属性特征,使得最终生成的哈希编码保留了图像的关键语义信息,获得了更高的图像检索准确率。
技术关键词
哈希编码方法
卷积神经网络提取
注意力机制
图像
编码场景
分支
视觉
解码器执行
计算机存储介质
上采样
图片
电子设备
处理器
存储器
通道
参数
系统为您推荐了相关专利信息
采样托盘
钻屑输送装置
运输系统
称重装置
集渣装置
数据分类
训练神经网络模型
注意力机制
系统资源使用率
自然语言
入侵植物监测
外来入侵植物
影像
训练集优化
植物监测技术