摘要
本发明公开了一种基于特征缓存优化的少样本分类方法研究,该方法包括:(1)使用一种基于改进的ResNet作为骨干的SwAV模型,用于生成辅助特征;(2)将图像数据和文本描述作为原始输入,利用GPT‑3生成具有丰富下游语言语义的文本输入,作为CLIP模型的文本提示;(3)通过基于特征相似性和差异性的特征选择方法,解决特征选择过程中存在的特征冗余和选择不准确的问题,识别出具有较高选择价值的特征维度,并对这些特征进行归一化和增强缩放处理;(4)利用SwAV的视觉对比知识,引入可学习的缓存模型,自适应地混合来自CLIP和SwAV的预测结果。本发明在无需额外训练的CLIP框架下,通过特征缓存优化和自适应混合策略,有效提高了少样本图像分类的准确性。
技术关键词
样本分类方法
特征选择方法
监督学习方法
视觉特征
图像
引入缓存机制
学习特征
标签
采样模块
文本特征向量
矩阵
文本编码器
因子
通用特征
深度学习模型
预训练模型
语义
系统为您推荐了相关专利信息
头颈部鳞状细胞癌
卷积神经网络模块
多模态特征
参数优化方法
深度学习模型训练
全息图像
输入神经网络模型
计算机程序指令
数据
尺寸
定位特征
RGB彩色图像
机动车周围环境
关键帧
地图
风格迁移方法
图像张量数据
实时图像
移动端
分块策略