摘要
本发明公开了一种基于零样本曼巴模型的图像识别方法,通过四种图像扫描策略确保了特征图中的每个元素都能够整合来自不同方向的信息。采用状态空间模型,特别是曼巴,对特征进行运算处理。使模型能够保持在保持线性计算复杂度的同时,对输入有着全局视野。在三个经典的图像分类数据集CUB,SUN和AWA2的传统零样本基准测试上得到,比传统ResNet、ViT模型提取的特征拥有更好的性能。证明本方法可以通过学习已见类图像的先验知识,并且利用曼巴模型的对全局图像特征进行学习,从而精确的识别未见类图像。
技术关键词
视觉特征
图像识别方法
文本编码器
扫描策略
代表
状态空间模型
序列特征
语义向量
样本
模块
线性
标签
注意力
模版
输出特征
融合特征
系统为您推荐了相关专利信息
触觉特征
定位特征
视觉特征
数据
扩展卡尔曼滤波器
光流场
统计学特征
周期性特征
激励响应分析
光流算法
计划优化方法
蒙特卡洛树搜索
智能模型
医药
决策
基站
定位算法
协方差矩阵
估计算法
鲁棒定位方法