摘要
本发明涉及一种基于特征增强的工业图像多标签分类方法,包括以下步骤:获取工业图像,输入基于特征增强的工业图像多标签分类网络,获得工业图像多标签分类结果;其中,基于特征增强的工业图像多标签分类网络包括图像特征重构增强模块、图像多模态特征增强模块和结果融合模块,图像特征重构增强模块包括分割层和重构层,重构层用于对切分后的特征进行基于多头自注意力机制的重构;图像多模态特征增强模块中引入CLIP编码器,用于对提示句和工业图像分别进行特征提取,据此计算多模态关联特征;结果融合模块用于融合前述两个模块的标签预测结果,获得最终的多标签分类结果。与现有技术相比,本发明可以进一步提高工业图像的多标签分类精度。
技术关键词
多标签分类方法
图像多模态
工业
重构
分类网络
注意力机制
模块
多模态特征
多层感知机
图像编码器
图像类别
图像块
系统为您推荐了相关专利信息
事理知识图谱
数据治理方法
冶金生产流程
工业网关
异常状态
融合系统
温度控制模块
重构模块
温度补偿单元
陀螺
评估管理方法
图谱
管理策略
多源时空数据
轨道交通数据