摘要
本发明公开了一种基于视觉增强的零样本工业缺陷检测方法、设备及介质,其中方法包括:采集工业产品图像及其对应的文本语义标签,构建训练集和测试集;搭建基于视觉增强的零样本工业缺陷检测模型,使用训练集进行训练;将测试集输入训练完成的模型进行推理和评估。模型由文本编码器和图像编码器构成,通过引入双向交叉注意力机制、多任务融合模块和图像特征精炼模块,实现文本与图像特征的深度交互与优化。在训练阶段,模型从部分工业产品类别中学习统一的缺陷特征;在测试阶段,从未接触过的工业产品类别上进行缺陷识别与定位。本发明有效降低对人工标注的依赖,提升模型在复杂工业场景下的适应性和检测精度,具备良好的可推广性和工业部署价值。
技术关键词
工业缺陷检测
图像编码器
工业产品图像
文本编码器
语义标签
双线性插值方法
样本
模块
多任务
视觉
调节图像特征
交叉注意力机制
像素
训练集
中间层
坐标
系统为您推荐了相关专利信息
文本特征向量
图像特征向量
模型优化系统
文本编码器
样本
农作物病害
图像编码器
文本编码器
混合模块
校准策略
标签管理系统
深度学习模型
企业级
客户
命名实体识别技术
语义地图
拓扑地图
混合地图构建方法
全景影像数据
惯性里程计