一种基于视觉语义双向引导的零样本食品图像检测方法

正文

推荐专利

申请号：CN202411908008

申请日期：2024-12-24

公开号：CN119649365A

公开日期：2025-03-18

类型：发明专利

摘要

本发明公开了一种基于视觉语义双向引导的零样本食品图像检测方法，属于图像数据处理及产生技术领域，其以基于Transformer的DETR为检测框架，并融合食品语义增强网络和跨模态双向引导模块。首先，将图像输入到图像骨干网络分支以提取视觉特征、将类别标签输入到食品语义增强网络分支以提取语义特征，然后，将得到的两种特征送入跨模态双向引导融合模块，该模块包括双向引导编码器、双向引导查询向量和双向引导解码器，通过编码和解码的过程对视觉和语义特征进行对齐融合，最后，在全连接层中完成零样本食品图像检测的回归和分类任务。本发明能够在检测过程中捕获细致的食品属性和视觉特征，实现视觉语义模态的有效互动，从而提升对未见食品类别的检测精度。

技术关键词

语义特征视觉特征图像检测方法交叉注意力机制样本标签嵌入特征分支损失函数优化图像数据处理解码器训练集广义食品类别网络匈牙利算法

系统为您推荐了相关专利信息

基于多元线性回归的电流/频率转换电路温度补偿方法

频率转换电路温度补偿方法电流线性回归方程高精度温度补偿

一种电压质量事件检测方法及系统

电压越限场景事件检测模型小水电工业园区

一种无线网络下隐私保护的分布式无线电地图感知方法

发射机无线电地图信息无线网络服务器决策

尿检仪及其控制方法

旋切阀流道样本洗涤液通道

基于带噪数据的图像识别方法和装置

分类识别模型噪声样本噪声识别图像识别方法数据

一种基于视觉语义双向引导的零样本食品图像检测方法

站点导航

APP 下载