摘要
本发明公开了一种基于多模态开集联想推理的变电站缺陷识别方法及系统,所述方法包括采集变电站油性设备缺陷图像并标注;构建图像‑文本匹配的多模态数据集;采用YOLOv8提取视觉特征,CLIP模型处理文本特征;设计重参数化视觉语言路径聚合网络进行特征融合;基于对比损失函数训练模型;通过多指标评估性能后部署应用;本发明通过多模态特征融合与重参数化路径聚合网络,有效解决了渗漏油缺陷因液体流动性与形态多变导致的标注困难问题,显著改善了多设备交叉干扰下的误检情况,结合多尺度特征学习与注意力机制,大幅提升了油污缺陷的识别准确性。
技术关键词
缺陷识别方法
变电站
视觉特征
多模态
注意力机制
精度检测方法
文本编码器
综合评估模型
油污
数据
多尺度特征学习
标签文本
标签文件
图像感兴趣区域
Sigmoid函数
策略
缺陷识别系统
系统为您推荐了相关专利信息
区域检测方法
瓦楞纸箱
注意力机制
色差缺陷
多尺度特征融合
编码向量
社交网络文本
情感分析方法
大语言模型
分类器
校正方法
卫星钟差数据
构建预测模型
群体智能算法
搜索算法