一种基于视觉大模型的开关闭合识别模型构建方法及开关闭合识别方法

AITNT
正文
推荐专利
一种基于视觉大模型的开关闭合识别模型构建方法及开关闭合识别方法
申请号:CN202411849966
申请日期:2024-12-16
公开号:CN119832298A
公开日期:2025-04-15
类型:发明专利
摘要
本申请公开了一种基于视觉大模型的开关闭合识别模型构建方法及开关闭合识别方法,所述开关闭合识别模型构建方法包括:S1:采集开关图像,制作数据集,所述数据集包括:图像文件和标签文件,标签文件中记录对应开关图像的种类和状态;S2:搭建ViT模型,S3:搭建CLIP模型,S4:模型训练;使用CLIP模型训练一个开关种类分类器,使用ViT模型训练一个开关闭合识别分类器;S5:模型融合,将基于CLIP模型的开关种类分类器和基于ViT模型的开关闭合识别分类器进行融合,从而获得开关闭合识别模型。通过本申请实现了在不同开关种类下,高效、准确地识别开关的闭合状态。
技术关键词
识别模型构建方法 分类器 文本编码器 图像编码器 标签文件 编码器模块 识别方法 前馈神经网络 识别开关 图像嵌入 双编码器 视觉 注意力机制 矩阵
系统为您推荐了相关专利信息
1
一种基于量子测控的射频信号多模态分析方法
量子态 量子相位估计 分析方法 多模态 信号
2
基于模型蒸馏的变声方法、装置、计算机设备及存储介质
变声方法 蒸馏 音频特征 语音 音频波形数据
3
基于动态依赖图与自监督学习的COPD早期筛查方法及应用
动态依赖图 早期筛查方法 图像块 胸部CT影像 学习特征
4
面向大范围耕地的蔬菜种植区监测系统及方法
指数特征 种植区 监测方法 样本 耕地
5
口腔图像多组织全自动分割方法
全自动分割方法 图像处理 组织 多级分类器 区域特征提取
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号