一种基于视觉大模型的开关闭合识别模型构建方法及开关闭合识别方法

正文

推荐专利

申请号：CN202411849966

申请日期：2024-12-16

公开号：CN119832298A

公开日期：2025-04-15

类型：发明专利

摘要

本申请公开了一种基于视觉大模型的开关闭合识别模型构建方法及开关闭合识别方法，所述开关闭合识别模型构建方法包括：S1：采集开关图像，制作数据集，所述数据集包括：图像文件和标签文件，标签文件中记录对应开关图像的种类和状态；S2：搭建ViT模型，S3：搭建CLIP模型，S4：模型训练；使用CLIP模型训练一个开关种类分类器，使用ViT模型训练一个开关闭合识别分类器；S5：模型融合，将基于CLIP模型的开关种类分类器和基于ViT模型的开关闭合识别分类器进行融合，从而获得开关闭合识别模型。通过本申请实现了在不同开关种类下，高效、准确地识别开关的闭合状态。

技术关键词

识别模型构建方法分类器文本编码器图像编码器标签文件编码器模块识别方法前馈神经网络识别开关图像嵌入双编码器视觉注意力机制矩阵

系统为您推荐了相关专利信息

一种基于量子测控的射频信号多模态分析方法

量子态量子相位估计分析方法多模态信号

基于模型蒸馏的变声方法、装置、计算机设备及存储介质

变声方法蒸馏音频特征语音音频波形数据

基于动态依赖图与自监督学习的COPD早期筛查方法及应用

动态依赖图早期筛查方法图像块胸部CT影像学习特征

面向大范围耕地的蔬菜种植区监测系统及方法

指数特征种植区监测方法样本耕地

口腔图像多组织全自动分割方法

全自动分割方法图像处理组织多级分类器区域特征提取

一种基于视觉大模型的开关闭合识别模型构建方法及开关闭合识别方法

站点导航

APP 下载