摘要
本发明公开了一种基于多模态视觉的缺陷检测方法及系统,方法包括以下步骤:对RGB图像和深度图像分别进行特征提取,获得多级RGB编码特征和多级深度编码特征;对多级RGB编码特征和多级深度编码特征进行跨模态特征融合,获得多级RGB‑D编码特征,同时生成含缺陷边缘特征的边缘图;根据多级RGB‑D编码特征和缺陷边缘特征进行解码,获得缺陷预测图。本发明的缺陷检测方法能够挖掘并利用与RGB特征在语义上能够匹配的深度信息,有效整合RGB与深度信息,以实现更深层次的特征融合,并增强缺陷特征的表示;同时,结合了粗粒度和细粒度的边缘信息,用于缺陷边界细化,实现更精确的缺陷区域定位。
技术关键词
编码特征
深度编码
缺陷检测方法
缺陷预测
缺陷检测系统
图像
跨模态
多模态
混合损失函数
解码模块
尺寸
特征提取模块
视觉
边缘检测
层级
网络
系统为您推荐了相关专利信息
LED灯珠
缺陷检测方法
凹陷特征
分布特征
像素点
信标
列车运行状态
图像
长短期记忆网络
注意力机制
多尺度特征
毛发
注射器
编解码器模型
缺陷检测方法
汽车部件
立体模型
表面缺陷检测方法
表面缺陷图像
定义
自然语言模型
BERT模型
编码特征
计算机执行指令
摘要