摘要
本发明公开了一种利用分割和负匹配的全局和组件细粒度食谱检索方法,属于食品计算中的食品跨模态检索技术领域。本发明在提取食物图像的全局特征时,结合SAM模型提取主要食物特征,在提取食谱的全局特征时同时保留标题、配料、指令三个的组件特征,之后设计了动态负匹配‑三元组联合损失函数:在全局层面利用食物图像和食谱的全局特征基于蒙特卡洛采样优化跨模态不匹配样本间距,利用组件层特征构建标题/配料/指令的细粒度负匹配损失以强化语义区分,并通过分割的主要食物特征与食谱配料特征的相似性矩阵约束对齐误差。通过以上方法有效解决了传统方法存在文本冗余干扰和图像背景噪声以及组件语义混淆等问题,进一步提高了检索召回率。
技术关键词
配料
样本
检索方法
联合损失函数
指令
三元组
图像全局特征
跨模态检索技术
图像分割
蒙特卡罗方法
矩阵
视觉
组件特征
语义
文本
匹配误差
标识符
因子
系统为您推荐了相关专利信息
冷热冲击试验设备
温度控制方法
墨水
偏差
温度控制系统
继电保护系统
远程控制方法
物理上行共享信道
指令
数字信号处理
信道状态信息资源
终端设备
CSI‑RS资源
报告
计算机程序产品
矫正人脸图像
光照特征
人脸模型
人脸图像处理方法
三维人脸网格