摘要
本申请属于计算机视觉技术领域,公开了一种互动式半自动异常检测标注方法、系统、设备及介质,该方法包括:获取工业产品待检测图像、表征异常区域位置的人工点击输入,以及缺陷类型的自然语言描述;基于无缺陷图像参考集,提取待检测图像各图像补丁的位置约束特征,计算像素级位置快速异常残差特征;利用预训练语言模型和判别编码器,将自然语言描述转换为判别性语言特征向量;通过残差特征分支处理残差特征,以语言特征向量引导,经跨模态注意力机制生成第一融合特征;以及像素信息分支结合点击输入处理原始像素信息生成第二融合特征;融合两特征并解码,得到像素级异常标注掩码,实现了对工业产品图像中异常区域的高精度半自动标注。
技术关键词
标注方法
融合特征
约束特征
自然语言
像素
注意力机制
分支
联合损失函数
跨模态
工业产品图像
网络
预训练语言模型
编码器
计算机视觉技术
信息处理
补丁
可读存储介质
标注系统
特征提取模块