一种基于多模态LLM实现缺陷目标检测的方法

正文

推荐专利

申请号：CN202410856252

申请日期：2024-06-28

公开号：CN118761977A

公开日期：2024-10-11

类型：发明专利

摘要

本发明涉及工业缺陷检测领域，具体涉及一种基于多模态LLM(大语言模型)实现缺陷目标检测的方法，其包括以下步骤：选择视觉语言模型作为基底模型；通过微调策略，对大规模行业数据进行多阶段训练，构建具有缺陷检测能力的多模态大模型，对模型进行缺陷grounding能力的微调训练；对模型进行无缺陷识别能力的微调训练；对模型进行ZeroShot能力的微调训练。该方法让多模态大模型在多场景上的适应性较强、在多站点多场景下适应性更佳。

技术关键词

多模态多阶段图片工业缺陷检测数据可读存储介质大语言模型标签处理器基底视觉策略多场景计算机设备模块存储器样本站点

系统为您推荐了相关专利信息

一种甲烷柱浓度确定方法、系统、存储介质及产品

甲烷反演模型风场管道气体检测设备

一种无线传输直播推流的全景音视频装置

传感模组小型传声器音视频数据存储器数据总线

基于长短期记忆网络模型的大风灾害天气指数预测系统

长短期记忆网络预测持续时间历史气象数据预测系统栅格化方法

基于深度学习的医院放射科影像自动解析方法、系统、设备以及电子介质

医学影像数据解析系统深度学习模型自动解析方法医院放射科影像

岸港场景下无人艇集群红蓝对抗协同决策方法与系统

无人艇集群决策方法海洋环境信息匈牙利算法动态避障

一种基于多模态LLM实现缺陷目标检测的方法

站点导航

APP 下载