摘要
本发明公开一种基于多模态协同的缺陷检测方法、装置、设备及介质,涉及人工智能领域,包括:对工件图像进行频域带阻滤波处理,得到预处理工件图像;检测预处理工件图像中的工件关键点;基于工件关键点,将预处理工件图像对齐到预设的标准位置,得到对齐工件图像;构建多模态提示特征向量,多模态提示特征向量包括基于对齐工件图像生成的视觉掩码特征和基于缺陷知识生成的文本特征;将对齐工件图像和多模态提示特征向量输入至预训练的图像分割模型,得到缺陷分割结果;基于缺陷分割结果进行缺陷置信度评估,以判定是否存在缺陷。本发明显著提升了工件缺陷检测的检测精度与鲁棒性。
技术关键词
多模态协同
缺陷检测方法
关键点
形态学特征
图像分割模型
文本特征向量
热力图
工件缺陷检测
缺陷检测装置
计算机设备
工业质检
生成知识
置信度阈值
视觉特征
处理器
系统为您推荐了相关专利信息
多任务损失函数
弱监督学习
图像
人体关键点检测
人体检测模块
人脸表情图像
面部情绪识别方法
面部表情识别模型
人脸特征向量
人脸特征融合
三维人脸点云数据
人脸生成方法
交换模块
球体
序列