摘要
本发明提出了一种基于语义解耦和扩散模型的零样本食品图像识别方法,以解决现有技术在零样本食品图像识别领域语义间隔和生成特征偏移问题。该方法通过构建食材‑烹饪双分支注意力网络,实现文本描述中食材构成与烹饪工艺的语义精准解耦,并利用跨模态融合策略捕获食材组合与烹饪方式的隐式关联,显著提升语义条件控制的精确性;在此基础上该方法设计区域感知扩散特征合成器,通过渐进式去噪过程生成具有空间敏感性的视觉特征,有效解决传统生成模型在食品纹理细节还原方面的不足。相比传统方法,本方案在特征生成质量、语义关系建模和复杂场景适应性方面具有显著优势,为食品计算领域提供了新的零样本检测解决方案。
技术关键词
食品图像识别方法
语义特征
生成特征
融合特征
变换器模块
分辨率
双线性插值
跨尺度特征融合
噪声
语义向量
规范化技术
组合模块
样本
视觉特征
空间结构信息
注意力机制
数据分布
系统为您推荐了相关专利信息
多模态特征融合
数据处理模型
数据存储
图谱
关键词提取模型
深度强化学习模型
回放模块
习惯
生成特征向量
决策
模态特征
双向注意力
障碍检测系统
多头注意力机制
跨模态
图像检测方法
光伏板组件
神经网络模型
图像分割模型
多尺度特征