基于语义解耦和扩散模型的零样本食品图像识别方法

正文

推荐专利

申请号：CN202510441599

申请日期：2025-04-09

公开号：CN120375361A

公开日期：2025-07-25

类型：发明专利

摘要

本发明提出了一种基于语义解耦和扩散模型的零样本食品图像识别方法，以解决现有技术在零样本食品图像识别领域语义间隔和生成特征偏移问题。该方法通过构建食材‑烹饪双分支注意力网络，实现文本描述中食材构成与烹饪工艺的语义精准解耦，并利用跨模态融合策略捕获食材组合与烹饪方式的隐式关联，显著提升语义条件控制的精确性；在此基础上该方法设计区域感知扩散特征合成器，通过渐进式去噪过程生成具有空间敏感性的视觉特征，有效解决传统生成模型在食品纹理细节还原方面的不足。相比传统方法，本方案在特征生成质量、语义关系建模和复杂场景适应性方面具有显著优势，为食品计算领域提供了新的零样本检测解决方案。

技术关键词

食品图像识别方法语义特征生成特征融合特征变换器模块分辨率双线性插值跨尺度特征融合噪声语义向量规范化技术组合模块样本视觉特征空间结构信息注意力机制数据分布

系统为您推荐了相关专利信息

一种多模态数据检索方法及系统

多模态特征融合数据处理模型数据存储图谱关键词提取模型

深度强化学习雾化习惯优化系统

深度强化学习模型回放模块习惯生成特征向量决策

一种基于层次跨模态注意力融合的焦虑障碍检测系统

模态特征双向注意力障碍检测系统多头注意力机制跨模态

一种基于多模态控制的人体视频生成方法及装置

驱动信号文本多模态运动特征视频生成方法

光伏板图像检测方法、存储介质和电子设备

图像检测方法光伏板组件神经网络模型图像分割模型多尺度特征

基于语义解耦和扩散模型的零样本食品图像识别方法

站点导航

APP 下载