摘要
本发明公开了一种基于视觉和文本提示的零部件异常检测方法,属于零部件检测技术领域,包括S1、获取零部件的视觉和文本提示数据;S2、将步骤S1中的视觉和文本提示数据,利用视觉‑文本预训练模型计算零部件的视觉特征和文本特征;S3、采用多模态融合模块将零部件的视觉特征和文本特征进行融合得到多模态融合特征;S4、根据多模态融合特征计算异常检测结果;S5、将多模态融合特征信息蒸馏到视觉分支;S6、将零部件的图像输入至视觉分支计算异常检测结果;本发明提供的一种基于视觉和文本提示的零部件异常检测方法,利用视觉‑语言预训练模型的鲁棒性和泛化性,可以在有限的零部件图像样本和文本描述作为训练数据时达到良好的异常检测效果。
技术关键词
异常检测方法
视觉特征
融合特征
预训练模型
多模态
分支
分类器
彩色图像
零部件检测技术
文本特征向量
双线性
图像编码器
蒸馏
数据
参数
注意力机制
系统为您推荐了相关专利信息
恢复器
光照
深度卷积网络
图像增强方法
全局平均池化
多模态交互
光电体积描记术
感知装置
在线增量学习
跨模态
直播方法
商品特征
协同过滤算法
推荐算法
建立用户画像
情感生成方法
多模态
模态特征
语义
智能情感交互