摘要
一种多层提示信息的多标签图像分类方法,包括:获取测试图像和训练集样本对应的标签集;利用主题模型得到训练集中所有样本的主题分布;在模型中学习一组表示主题标签分布信息的提示块,将提示块Prompt Token注入到中间特征中,输入进选定的提示层Prompt Block中;最后由Vision Transformer的输出结果判断该样本隶属于哪些类别。与现有技术相比,本发明增进了多标签分类任务的精准度,有助于注意力机制关注到更小的、对于区分物体属于哪一类别更加关键的区域,一定程度上能够弥补标签的缺失和错误,提高了模型的鲁棒性,同时降低了人力成本。
技术关键词
图像分类方法
主题模型
样本
训练集
交叉注意力机制
多标签
自然场景
代表
彩色图像
自然语言
实体
分类器
鲁棒性
元素
图片
视觉
系统为您推荐了相关专利信息
纹理识别方法
触觉传感器
磁流变弹性体
霍尔传感器阵列
触觉感知技术
干扰信号识别方法
构建卷积神经网络
训练卷积神经网络
样本
可读存储介质
异常检测方法
切粒机
冲击特征
深度学习模型
时序特征
SAR回波信号
注意力机制
短时傅里叶变换
SAR干扰抑制方法
标签
时间序列预测模型
时间序列预测方法
补丁
混合损失函数
多尺度