摘要
本申请公开了一种基于视觉大模型的开关闭合识别模型构建方法及开关闭合识别方法,所述开关闭合识别模型构建方法包括:S1:采集开关图像,制作数据集,所述数据集包括:图像文件和标签文件,标签文件中记录对应开关图像的种类和状态;S2:搭建ViT模型,S3:搭建CLIP模型,S4:模型训练;使用CLIP模型训练一个开关种类分类器,使用ViT模型训练一个开关闭合识别分类器;S5:模型融合,将基于CLIP模型的开关种类分类器和基于ViT模型的开关闭合识别分类器进行融合,从而获得开关闭合识别模型。通过本申请实现了在不同开关种类下,高效、准确地识别开关的闭合状态。
技术关键词
识别模型构建方法
分类器
文本编码器
图像编码器
标签文件
编码器模块
识别方法
前馈神经网络
识别开关
图像嵌入
双编码器
视觉
注意力机制
矩阵
系统为您推荐了相关专利信息
动态依赖图
早期筛查方法
图像块
胸部CT影像
学习特征
全自动分割方法
图像处理
组织
多级分类器
区域特征提取