摘要
本发明涉及工业缺陷检测领域,具体涉及一种基于多模态LLM(大语言模型)实现缺陷目标检测的方法,其包括以下步骤:选择视觉语言模型作为基底模型;通过微调策略,对大规模行业数据进行多阶段训练,构建具有缺陷检测能力的多模态大模型,对模型进行缺陷grounding能力的微调训练;对模型进行无缺陷识别能力的微调训练;对模型进行ZeroShot能力的微调训练。该方法让多模态大模型在多场景上的适应性较强、在多站点多场景下适应性更佳。
技术关键词
多模态
多阶段
图片
工业缺陷检测
数据
可读存储介质
大语言模型
标签
处理器
基底
视觉
策略
多场景
计算机设备
模块
存储器
样本
站点
系统为您推荐了相关专利信息
传感模组
小型传声器
音视频
数据存储器
数据总线
长短期记忆网络
预测持续时间
历史气象数据
预测系统
栅格化方法
医学影像数据
解析系统
深度学习模型
自动解析方法
医院放射科影像
无人艇集群
决策方法
海洋环境信息
匈牙利算法
动态避障