一种跨模态食品检索方法

AITNT
正文
推荐专利
一种跨模态食品检索方法
申请号:CN202411890626
申请日期:2024-12-20
公开号:CN119903203B
公开日期:2025-11-07
类型:发明专利
摘要
本发明涉及人工智能和机器学习的跨学科研究领域,尤其涉及。本发明提供了一种跨模态食品检索方法,重点是在图像编码器与食谱编码器的基础上增加多粒度交互编码器构建TE I框架,将给定的图像‑文本配对数据分别输入到图像编码器与食谱编码器进行训练学习,图像编码器提取全局视觉特征,食谱编码器提取层次化特征并使用线性层获得全局食谱特征,多粒度交互编码器提取多粒度特征,所述层次化特征与多粒度特征计算成对的自注意力并取平均值得多粒度交互特征,基于层次化语义对齐损失函数对齐两种模态之间的相关性。目的是探索图像和文本模态之间的多粒度互动相关性,以提高跨模态检索性能。
技术关键词
图像编码器 检索方法 跨模态 全局视觉特征 层次化语义 多粒度特征 交互特征 文本 变换器 线性 注意力 三元组 数据 框架 基础 指令 实体
系统为您推荐了相关专利信息
1
一种基于跨模态语义融合的路网信息增强方法
跨模态 词语 BERT模型 前馈神经网络 图谱
2
一种棕榈油种植园多模态决策管理方法、系统、设备及介质
异构终端设备 决策管理方法 种植业 多模态 无人机
3
一种基于自监督学习的多模态图像补全方法
图像补全方法 编码器 解码器 跨模态图像 融合特征
4
基于3D时空感知与类人决策推理的自动驾驶大模型框架
场景 决策 跨模态 文本编码器 联合损失函数
5
一种层次化城市运行智能体记忆管理方法及系统
记忆管理 因子 综合语义 条目 图谱
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号