基于多模态大模型的表观缺陷检测方法及系统

正文

推荐专利

申请号：CN202510258419

申请日期：2025-03-06

公开号：CN119762485B

公开日期：2025-05-16

类型：发明专利

摘要

本发明公开了一种基于多模态大模型的表观缺陷检测方法及系统。首先，设计提示词，利用GPT‑4V自动标注缺陷图像来构建缺陷图像‑掩膜‑文字描述数据集；其次，利用此数据集微调预训练的大语言骨干网络，使其能更好地理解缺陷检测任务；然后，针对编码器各层视觉特征，设计了一种多视觉尺度token组机制，再利用轻量级掩膜解码器输出缺陷检测结果；最后，结合大语言骨干网络的文字描述输出，设计了一种结合缺陷检测掩膜和缺陷文字描述的缺陷检测算法，大幅提高了工业生产环境中的缺陷检测准确率。

技术关键词

表观缺陷检测方法视觉特征多模态编码器掩膜解码器缺陷检测算法图像工业生产环境网络多尺度数据多视觉处理器注意力标签存储装置

基于多模态大模型的表观缺陷检测方法及系统

站点导航

APP 下载