基于语义解耦和扩散模型的零样本食品图像识别方法

AITNT
正文
推荐专利
基于语义解耦和扩散模型的零样本食品图像识别方法
申请号:CN202510441599
申请日期:2025-04-09
公开号:CN120375361A
公开日期:2025-07-25
类型:发明专利
摘要
本发明提出了一种基于语义解耦和扩散模型的零样本食品图像识别方法,以解决现有技术在零样本食品图像识别领域语义间隔和生成特征偏移问题。该方法通过构建食材‑烹饪双分支注意力网络,实现文本描述中食材构成与烹饪工艺的语义精准解耦,并利用跨模态融合策略捕获食材组合与烹饪方式的隐式关联,显著提升语义条件控制的精确性;在此基础上该方法设计区域感知扩散特征合成器,通过渐进式去噪过程生成具有空间敏感性的视觉特征,有效解决传统生成模型在食品纹理细节还原方面的不足。相比传统方法,本方案在特征生成质量、语义关系建模和复杂场景适应性方面具有显著优势,为食品计算领域提供了新的零样本检测解决方案。
技术关键词
食品图像识别方法 语义特征 生成特征 融合特征 变换器模块 分辨率 双线性插值 跨尺度特征融合 噪声 语义向量 规范化技术 组合模块 样本 视觉特征 空间结构信息 注意力机制 数据分布
系统为您推荐了相关专利信息
1
一种多模态数据检索方法及系统
多模态特征融合 数据处理模型 数据存储 图谱 关键词提取模型
2
深度强化学习雾化习惯优化系统
深度强化学习模型 回放模块 习惯 生成特征向量 决策
3
一种基于层次跨模态注意力融合的焦虑障碍检测系统
模态特征 双向注意力 障碍检测系统 多头注意力机制 跨模态
4
一种基于多模态控制的人体视频生成方法及装置
驱动信号 文本 多模态 运动特征 视频生成方法
5
光伏板图像检测方法、存储介质和电子设备
图像检测方法 光伏板组件 神经网络模型 图像分割模型 多尺度特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号