摘要
本发明公开了一种基于类激活图的排水管缺陷识别和定位方法、系统,属于排水管网缺陷检测领域。通过文本编码器处理数据集标签描述和可学习类别提示,生成标签文本特征与类别提示特征,同时利用视觉编码器提取排水管图像的局部特征和全局特征。随后融合类别提示特征与图像局部特征,再结合图像全局特征及标签文本特征得到全局融合类别提示特征。计算全局融合类别提示特征与转换后的图像局部特征的相似度,生成多标签分类结果;通过提示增强训练优化模型参数(冻结文本编码器)。基于Grad‑CAM技术处理分类结果生成类激活图,经插值与映射输出可视化热图以定位缺陷位置。本发明融合类激活图技术实现缺陷区域的准确识别和可视化定位。
技术关键词
图像局部特征
定位方法
文本编码器
排水管
图像全局特征
标签文本
CAM技术
多标签
生成标签
预测图像样本
定位缺陷位置
模块
模型训练方法
双线性插值
注意力
序列
系统为您推荐了相关专利信息
故障定位模型
链路故障定位方法
MAC地址表
故障定位系统
LCD显示屏
变电站故障
定位方法
注意力
特征提取模块
数据处理器
定位方法
相机
罗德里格斯参数
卡尔曼滤波
识别算法
视觉定位模块
视觉定位方法
多尺度特征融合
机械手
坐标系