一种基于上下文感知代理交互与融合的深度哈希食品图像检索方法

AITNT
正文
推荐专利
一种基于上下文感知代理交互与融合的深度哈希食品图像检索方法
申请号:CN202510607146
申请日期:2025-05-12
公开号:CN120632140A
公开日期:2025-09-12
类型:发明专利
摘要
本发明公开了一种基于上下文感知代理交互与融合的深度哈希食品图像检索方法及网络,涉及图像检索技术领域。包括以下步骤:1)、输入图像与数据库;2)、特征提取过程;3)、特征交叉融合过程;4)、使用两种损失函数共同优化网络;5)对上述步骤进行模型训练和性能评估;6)、输出结果,利用训练好的模型对输入的查询图像进行处理,提取食品图像的视觉特征,并将其与食品图像数据库中的图像进行比较,通过相似度计算,找到与查询图像最相似的一系列图像,并将其作为检索结果输出。本发明将卷积交互的思想和Transformer相结合,既能提取食品图像局部细粒度语义信息,又能实现局部和全局的信息交互,从而生成更准确的食品图像哈希码表示,解决现有检索方法无法有效学习食品图像复杂的细粒度视觉特征和关键食品区域特征提取不足的问题。
技术关键词
图像检索方法 深度哈希 视觉特征 编码器模块 局部细节特征 矩阵 区域特征提取 图像检索技术 度度量方法 注意力 标签 超参数 网络 图像类别 定义 训练算法 汉明距离 样本
系统为您推荐了相关专利信息
1
一种基于神经网络的多模态医学图像处理方法及装置
医学图像处理方法 视觉特征提取 标签 超像素特征 分辨率
2
花粉活力检测模型构建和花粉活力检测方法、装置及设备
检测模型构建方法 活力检测方法 数据 视觉特征提取 图像
3
基于AI视觉辅助监管的智能发射台管理系统
数据采集模块 数据分析模块 LSTM模型 中央控制模块 注意力机制
4
一种基于智能三维视觉的城市洪涝水深实时监测方法
实时监测方法 稠密特征 无人机 图像 三维模型
5
基于多模态检索增强和指南引导的医疗诊断方法和系统
医疗诊断方法 医学影像信息 多模态 医学知识库 视觉特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号