摘要
本发明为面向多场景智能制造缺陷检测大模型训练方法。该方法采用掩码自编码的ViTDeT主干预训练、DINO检测头对比预训练、有监督数据标注图像端到端微调;ViTDeT主干预训练的训练任务是生成被遮掩部分的HOG特征描述符,在预训练完成后,舍弃掩码解码器部分,保留ViTDeT主干的权重;对比以ViTDeT主干构成的孪生网络中,两个DINO检测头输出的特征,使其尽可能相似的同时,拟合伪边界框的位置。采用有标注的图像数据微调此预训练缺陷检测模型。将训练后的缺陷检测模型用于不同场景下智能制造产品的缺陷检测。采用分阶段的方式对多场景智能制造缺陷检测大模型进行训练,提升了大模型对大规模无标注数据的利用率,同时提高了其对不同场景缺陷的检测精度。
技术关键词
面向多场景
模型训练方法
特征描述符
多层感知器
检测头
表面缺陷检测
注意力
解码器
图像标注信息
太阳能电池
多尺度特征
多晶硅
数据
搜索算法
图像增强
分阶段
工业
系统为您推荐了相关专利信息
注意力机制
卷积神经网络结构
检测头
森林火灾检测方法
特征提取网络
检测网络模型
数据
多尺度特征融合
检测头
格式化
图像分割方法
语义分割模型
变换算法
梯度方向直方图
像素