摘要
本发明公开了基于两级提示的持续学习方法,包括:将输入图像输入至参数冻结的CLIP图像编码器生成图像嵌入,并将图像嵌入与前缀标记拼接形成拼接图像嵌入;将输入图像对应的输入文本提示与类别名称关联形成第一级提示,并将第一级提示输入至参数冻结的CLIP文本编码器生成文本嵌入;计算图像嵌入和文本嵌入的相似度,并利用自适应权重对相似度进行调整、从而得到调整后的相似度分数中最大的K个值以形成第二级提示;将拼接图像嵌入和第二级提示输入至预训练模型VIT中,输出得到最终嵌入、并将最终嵌入进行softmax操作得到最终预测。本发明无需微调任何参数,不需要任何缓冲区来存储过去的实例样本,适用于数据隐私敏感的场景。
技术关键词
图像嵌入
持续学习方法
文本编码器
图像编码器
标记
预训练模型
蒸馏
超参数
标签
代表
语义
样本
场景
数据
系统为您推荐了相关专利信息
视频标注方法
关键帧
图像分割模型
对象
视频标注装置
文本特征向量
分析位置信息
关键词
情感特征
数据监测技术
局部注意力机制
语言编码器
自然语言
融合注意力机制
阶段
GNSS电离层
GNSS接收机
低成本
高频设备
预警方法