摘要
本发明公开了一种融合注意力机制的多标签图像识别方法及装置,包括:获取多标签图像;对多标签图像进行预处理,得到预处理图像;提取预处理图像的局部特征和标签位置特征;根据局部特征和标签位置特征确定查询信息,计算查询信息中关键词的相关性,经softmax函数归一化得到权重,再计算加权和得到注意力值,确定关系特征;将注意力机制融入多标签图像类别识别模型中,将关系特征与局部特征融合,确定融合特征,并输入下一级网络进行信息传递,直至确定输出结果;根据输出结果和预设的分类阈值,确定预处理图像所属的多个类别标签。便于提高对多标签图像的分类效率及分类准确性。
技术关键词
融合注意力机制
图像识别方法
多标签图像
颜色直方图
像素点
分类阈值
关键词
融合特征
Softmax函数
局部图像特征
引入注意力机制
标记
关系
图像分割算法
通道
系统为您推荐了相关专利信息
边缘结构信息
边缘检测模型
空间注意力模型
融合特征
图像处理方法
输电线路覆冰厚度
覆冰输电线
实例分割算法
输电线路覆冰图像
编码掩膜
鼻腔结构
评价装置
温湿度控制模块
数据分析模块
鼻用制剂
偏光片
纹理分布特征
图像数据集合
空间分布特征
缺陷类别