摘要
基于多模态大模型的工业图像异常检测方法,属于工业异常检测领域,本发明为解决多模态大模型进行工业异常检测时存在可扩展性和适应性差、在图像中识别微小异常能力弱的问题。本发明包括步骤1、基于工业异常检测数据集构建知识理解训练任务,步骤2、利用专家引导的图像采样模块预测异常图并提取N个感兴趣区域,将N个感兴趣区域连同输入的原图一起输入视觉编码器中,以提取视觉特征,并输出大语言模型能识别的视觉编码;步骤3、构建视觉语言对齐的工业异常检测指令集;步骤4、利用知识理解训练任务和工业异常检测指令集对多模态大模型进行微调;步骤5、利用训练好的多模态大模型对工业产品进行异常检测。
技术关键词
图像异常检测方法
多模态
工业
视觉特征
大语言模型
感兴趣
采样模块
文本
微调方法
算法
答案
数据
样本
多任务
原型
粗略
指令
图片
系统为您推荐了相关专利信息
编码特征
视频帧
时空注意力模型
大语言模型
视频理解方法
硅基气凝胶
硅基纳米结构
智能设计方法
多模态
参数
多模态特征融合
信息检测方法
文本特征向量
通信管理模块
IM软件