摘要
本申请公开了一种基于视觉‑语言模型的工业缺陷检测方法和相关设备,方法包括:根据图像数据集,对基于预训练视觉‑语言模型构建的工业缺陷检测模型进行训练,得到最佳模型,并提取出最佳模型的最佳模型权重;工业缺陷检测模型的特征映射模块用于实现视觉特征与文本语义空间的对齐,文本提示生成模块用于动态生成文本提示;将最佳模型权重载入待检测工业缺陷检测模型,得到目标工业缺陷检测模型;将待检测图像输入目标工业缺陷检测模型进行缺陷检测,得到目标缺陷检测结果。本申请无需为每个新类别图像重新训练模型,能对未出现过的样本进行检测,以适应不同类别的产品检测需求,提高模型检测效率和准确率,可广泛应用于人工智能技术领域。
技术关键词
工业缺陷检测
视觉特征
训练图像数据
检测工业
文本编码器
双三次插值
模型训练模块
可读存储介质
人工智能技术
计算机程序产品
处理器
语义
电子设备
动态
上采样