摘要
本发明属于计算机视觉技术领域,公开了一种基于图像‑文本预训练模型的少样本分类方法。对于基元级最优运输,提出基于原型距离的图像块重加权机制。将原型和图像块之间的欧氏距离转换为每个图像块的权重,从而为图像块分配不同的权值。针对提示级阶段,提出级联最优运输模块,不仅考虑少样本图像‑文本特征之间的最优运输,还考虑零样本和少样本图像‑文本特征之间的交叉最优运输。提出一种基于原型的非平衡一致性损失函数来监督网络。该损失函数分为原型距离损失和非平衡一致性损失。在Caltech01、DTD、EuroSAT数据集上进行测试,从实验结果可以证明本发明所提出的网络模型性能优于目前最先进的算法,验证了算法的有效性。
技术关键词
样本分类方法
基元
预训练模型
原型
分支
图像块
运输模块
分类网络
文本编码器
图像编码器
代表
特征提取模块
计算机视觉技术
矩阵
定义
计算方法
标签
系统为您推荐了相关专利信息
分布式光纤传感
信号识别方法
声光调制器
超窄线宽激光器
掺铒光纤放大器
管道巡检机器人
行走轮组件
关节
球形轮
传动齿轮组
音频控制方法
座位
联合聚类方法
震动传感器
人物模型