多层提示信息的多标签图像分类方法

AITNT
正文
推荐专利
多层提示信息的多标签图像分类方法
申请号:CN202411491288
申请日期:2024-10-24
公开号:CN119445216B
公开日期:2025-05-30
类型:发明专利
摘要
一种多层提示信息的多标签图像分类方法,包括:获取测试图像和训练集样本对应的标签集;利用主题模型得到训练集中所有样本的主题分布;在模型中学习一组表示主题标签分布信息的提示块,将提示块Prompt Token注入到中间特征中,输入进选定的提示层Prompt Block中;最后由Vision Transformer的输出结果判断该样本隶属于哪些类别。与现有技术相比,本发明增进了多标签分类任务的精准度,有助于注意力机制关注到更小的、对于区分物体属于哪一类别更加关键的区域,一定程度上能够弥补标签的缺失和错误,提高了模型的鲁棒性,同时降低了人力成本。
技术关键词
图像分类方法 主题模型 样本 训练集 交叉注意力机制 多标签 自然场景 代表 彩色图像 自然语言 实体 分类器 鲁棒性 元素 图片 视觉
系统为您推荐了相关专利信息
1
一种纹理识别方法、系统、介质、设备及触觉传感器
纹理识别方法 触觉传感器 磁流变弹性体 霍尔传感器阵列 触觉感知技术
2
一种基于人工特征图与卷积神经网络的干扰信号识别方法、系统、设备及介质
干扰信号识别方法 构建卷积神经网络 训练卷积神经网络 样本 可读存储介质
3
一种切粒机切割精度的异常检测方法及系统
异常检测方法 切粒机 冲击特征 深度学习模型 时序特征
4
一种SAR多类型干扰抑制与分割方法
SAR回波信号 注意力机制 短时傅里叶变换 SAR干扰抑制方法 标签
5
基于多尺度补丁并行预测网络的时间序列预测方法及装置
时间序列预测模型 时间序列预测方法 补丁 混合损失函数 多尺度
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号