摘要
本发明公开了一种基于预训练大模型的零样本图像属性标注方法,属于图像标注领域,通过获取预训练大语言模型,与其交互,经初步定义属性、重复筛选细化属性、属性定义取值步骤,得到一组对特定域内类别识别有辨别性的属性取值;将定义的属性及其常见取值转换为成组候选文本选项,获取视觉‑语言模型,利用其图文检索能力标注每张图像中每个属性取值的呈现程度,并将图像标注转化为类别标注。本发明基于预训练模型的能力,提出为零样本学习设计并标注属性的方法,降低了零样本学习训练方法对人工标注数据的依赖。
技术关键词
大语言模型
标注方法
零样本图像分类
图像嵌入
转化方法
学习训练方法
视觉
图文
文本编码器
图像编码器
预训练模型
定义
编程
数据
模板
序列