摘要
本发明公开了一种基于上下文感知代理交互与融合的深度哈希食品图像检索方法及网络,涉及图像检索技术领域。包括以下步骤:1)、输入图像与数据库;2)、特征提取过程;3)、特征交叉融合过程;4)、使用两种损失函数共同优化网络;5)对上述步骤进行模型训练和性能评估;6)、输出结果,利用训练好的模型对输入的查询图像进行处理,提取食品图像的视觉特征,并将其与食品图像数据库中的图像进行比较,通过相似度计算,找到与查询图像最相似的一系列图像,并将其作为检索结果输出。本发明将卷积交互的思想和Transformer相结合,既能提取食品图像局部细粒度语义信息,又能实现局部和全局的信息交互,从而生成更准确的食品图像哈希码表示,解决现有检索方法无法有效学习食品图像复杂的细粒度视觉特征和关键食品区域特征提取不足的问题。
技术关键词
图像检索方法
深度哈希
视觉特征
编码器模块
局部细节特征
矩阵
区域特征提取
图像检索技术
度度量方法
注意力
标签
超参数
网络
图像类别
定义
训练算法
汉明距离
样本
系统为您推荐了相关专利信息
医学图像处理方法
视觉特征提取
标签
超像素特征
分辨率
检测模型构建方法
活力检测方法
数据
视觉特征提取
图像
数据采集模块
数据分析模块
LSTM模型
中央控制模块
注意力机制
医疗诊断方法
医学影像信息
多模态
医学知识库
视觉特征