基于预训练视觉-语言模型的零样本图像异常检测定位方法

正文

推荐专利

申请号：CN202411551972

申请日期：2024-11-01

公开号：CN119206369A

公开日期：2024-12-27

类型：发明专利

摘要

本发明提出一种基于预训练视觉‑语言模型的零样本图像异常检测定位方法，涉及图像异常检测定位的技术领域，利用通用的视觉异常检测数据集训练可学习适配器和可学习文本提示，在文本特征方面，构建正常状态文本提示和异常状态文本提示，并分别获取了正常状态文本表征和异常状态文本表征。在图像特征方面，获取图像在图片编码器中不同层次的表征，通过不同尺度的窗口大小，聚合不同尺度邻居信息的图像特征并利用适配器调整。最后，计算文本‑图像特征之间的相似度，使用归一化的方式获取图像分类为异常的概率得分。本发明利用通用异常数据集训练可学习文本提示和可学习适配器，解决训练样本无法获取时如何进行图像异常检测的问题，使得预训练模型能够适配于目标检测数据集，有效地进行零样本检测和定位。

技术关键词

检测定位方法图像块特征异常状态适配器表达式视觉二维图像特征文本编码器图片样本邻居序列数据参数注意力语义

系统为您推荐了相关专利信息

基于IAPM和FDAF的矿区遥感变化检测方法

变化检测方法语义特征表达式特征提取网络图像

一种基于隐私保护的数据传输方法

数据传输方法接收端大规模分布式存储系统加密控制器表达式

一种电源时序的管理方法和电源设备

CPLD芯片电源模块电源设备异常状态管理方法

一种电网自治运行的光储协同方法、系统、设备及介质

虚拟同步发电机同步转子协同方法状态空间方程协同系统

一种防止细菌传播的手部清洁方法

洗手液用量清洁方法光带手掌颜色

基于预训练视觉-语言模型的零样本图像异常检测定位方法

站点导航

APP 下载