摘要
本发明公开了一种噪声抑制模态融合对齐的工业图像异常检测方法,属于图像检测技术领域。该方法包括:获取正常工业图像样本和带有标签的异常工业图像样本;构建工业图像异常检测模型,包括文本编码器、双通道图像编码器、MLP模块以及多模态交互模块;利用训练集对工业图像异常检测模型进行训练;利用训练后的工业图像异常检测模型对测试集中的图像样本进行异常检测。本发明在文本编码器中使用噪声抑制注意力机制使得模型更加关注提示词中的重点语义,减轻无关语义的干扰;通过为异常提示引入位置信息,增加文本模态带来的信息量,帮助模型更好地理解异常发生的具体区域,增强模型的空间感知能力。
技术关键词
图像异常检测方法
噪声抑制
补丁
图像编码器
文本编码器
多模态交互
图像嵌入
工业
矩阵
注意力机制
模板
多层感知机
图像检测技术
样本
上采样
代表
模块
系统为您推荐了相关专利信息
音频特征
音频编码器
生成对抗网络
图像编码器
语音
高压开关壳体
远程监控方法
滤波算法
热传导
平台
文本识别模型
编码特征
文本编码器
图片解码器
参数
文本编码器
推送方法
信息处理
案例库
地理位置信息