一种跨模态食品检索方法

正文

推荐专利

一种跨模态食品检索方法

申请号：CN202411890626

申请日期：2024-12-20

公开号：CN119903203B

公开日期：2025-11-07

类型：发明专利

摘要

本发明涉及人工智能和机器学习的跨学科研究领域，尤其涉及。本发明提供了一种跨模态食品检索方法，重点是在图像编码器与食谱编码器的基础上增加多粒度交互编码器构建TE I框架，将给定的图像‑文本配对数据分别输入到图像编码器与食谱编码器进行训练学习，图像编码器提取全局视觉特征，食谱编码器提取层次化特征并使用线性层获得全局食谱特征，多粒度交互编码器提取多粒度特征，所述层次化特征与多粒度特征计算成对的自注意力并取平均值得多粒度交互特征，基于层次化语义对齐损失函数对齐两种模态之间的相关性。目的是探索图像和文本模态之间的多粒度互动相关性，以提高跨模态检索性能。

技术关键词

图像编码器检索方法跨模态全局视觉特征层次化语义多粒度特征交互特征文本变换器线性注意力三元组数据框架基础指令实体

系统为您推荐了相关专利信息

一种基于跨模态语义融合的路网信息增强方法

跨模态词语 BERT模型前馈神经网络图谱

一种棕榈油种植园多模态决策管理方法、系统、设备及介质

异构终端设备决策管理方法种植业多模态无人机

一种基于自监督学习的多模态图像补全方法

图像补全方法编码器解码器跨模态图像融合特征

基于3D时空感知与类人决策推理的自动驾驶大模型框架

场景决策跨模态文本编码器联合损失函数

一种层次化城市运行智能体记忆管理方法及系统

记忆管理因子综合语义条目图谱

一种跨模态食品检索方法

站点导航

APP 下载