基于多模态大模型的工业图像异常检测方法

AITNT
正文
推荐专利
基于多模态大模型的工业图像异常检测方法
申请号:CN202411973769
申请日期:2024-12-30
公开号:CN119762891B
公开日期:2025-09-30
类型:发明专利
摘要
基于多模态大模型的工业图像异常检测方法,属于工业异常检测领域,本发明为解决多模态大模型进行工业异常检测时存在可扩展性和适应性差、在图像中识别微小异常能力弱的问题。本发明包括步骤1、基于工业异常检测数据集构建知识理解训练任务,步骤2、利用专家引导的图像采样模块预测异常图并提取N个感兴趣区域,将N个感兴趣区域连同输入的原图一起输入视觉编码器中,以提取视觉特征,并输出大语言模型能识别的视觉编码;步骤3、构建视觉语言对齐的工业异常检测指令集;步骤4、利用知识理解训练任务和工业异常检测指令集对多模态大模型进行微调;步骤5、利用训练好的多模态大模型对工业产品进行异常检测。
技术关键词
图像异常检测方法 多模态 工业 视觉特征 大语言模型 感兴趣 采样模块 文本 微调方法 算法 答案 数据 样本 多任务 原型 粗略 指令 图片
系统为您推荐了相关专利信息
1
一种基于关键词提示的细粒度关系抽取数据增强方法
关键词 实体 关系 大语言模型 三元组
2
基于多模态数据融合的耳鼻喉科智能诊断与监测系统
内窥镜 多模态数据融合 像素点 决策 监测系统
3
一种视频理解方法、系统、电子设备和存储介质
编码特征 视频帧 时空注意力模型 大语言模型 视频理解方法
4
一种基于多模态大模型的硅基气凝胶纳米结构智能设计方法及相关装置
硅基气凝胶 硅基纳米结构 智能设计方法 多模态 参数
5
IM软件多模态特征融合的即时涉密信息检测方法及系统
多模态特征融合 信息检测方法 文本特征向量 通信管理模块 IM软件
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号