摘要
本申请涉及一种基于CLIP模型的零样本工业瑕疵检测方法。该方法通过构建带有局部特征引导前缀和异常状态条件后缀的优化提示词模板引导CLIP文本编码器聚焦异常区域,生成增强语义的文本描述集合;基于该文本描述集合和工业图像,利用CLIP双编码器分别提取视觉块令牌特征及细粒度文本嵌入特征;通过对文本与视觉特征执行残差映射与加权融合处理;将融合后的视觉特征分割至多子空间进行并行残差映射与门控路由融合,解耦不同模态的异常特征;基于优化后的跨模态特征计算图像级异常概率与像素级热力图。实现在严格零样本条件下对工业产品细微瑕疵的高精度检测与定位,显著提升对局部缺陷的判别鲁棒性,同时维持轻量化部署优势。
技术关键词
嵌入特征
视觉特征
文本编码器
异常状态
瑕疵检测方法
检测工业
令牌
热力图
瑕疵检测系统
图像局部特征
表达式
融合特征
像素
样本
标签
语义
系统为您推荐了相关专利信息
声学特征
人机交互方法
视觉特征
感知特征
历史交互信息
风格化生成方法
美术
多模态
自然语言文本
视觉特征提取
图像增强系统
双通道神经网络
图像压缩单元
视觉特征
图像增强模块