摘要
本发明提供一种多标签图像分类方法、装置、设备、存储介质及程序产品,应用于图像处理技术领域。该方法包括:获取待分类图像的高分辨率特征图,所述待分类图像中包括至少两个物体类别;确定所述待分类图像的至少两个物体类别的像素掩码,将所述像素掩码映射到所述高分辨率特征图上进行掩码平均操作,得到目标图像特征;将包含类别属性描述与类别名称的文本特征与所述高分辨率特征图进行交互处理,得到包含视觉信息的目标文本特征;将所述目标图像特征与所述目标文本特征进行匹配,以确定所述待分类图像的类别标签。
技术关键词
图像分类方法
注意力
多标签图像
图像分类模型
非暂态计算机可读存储介质
像素
物体
视觉
文本编码器
处理器
线性
上采样
图像处理技术
大语言模型
计算机程序产品
分类装置
系统为您推荐了相关专利信息
脉冲特征
矩阵
多尺度特征融合
跨尺度特征融合
联合损失函数
预处理图像数据
车厢
自动识别方法
铁路货车
字符
分类系统
特征提取模块
图像增强模块
模板
边界特征