摘要
本发明公开了一种基于Vision Mamba的隐式对比学习方法,通过引导梯度停止在自监督学习网络架构上实现隐式对比学习,在图像分类任务上取得更好的性能指标;对于输入的图像,本方法通过数据增强获取图像的正样本对视图,使用线性投影获取视图的嵌入表示,通过加入位置嵌入和类别标签,获取图像在空间中的位置信息,理解图像的全局结构和局部特征,并从前后两个方向经过一维卷积层和状态空间模型Mamba的S6层处理,获取图像的特征向量。在自监督学习网络架构中引导梯度停止,控制正样本对的特征向量在特征空间中单方向靠近,达到负样本远离的实际效果,实现隐式对比学习,使模型性能得到提升。
技术关键词
学习方法
编码器
序列
样本
网络架构
状态空间模型
图像块
处理器
计算机程序产品
标签
框架
可读存储介质
存储器
电子设备
参数
数据