摘要
本申请提供了一种基于状态空间模型的轻量化零样本图像分类方法及系统,该方法包括:将未见类别测试样本输入到训练好的零样本图像分类网络模型,输出未见类图像分类结果;所述零样本图像分类网络模型,包括视觉编码器、语义编码器、多模融合模块和分类模块;其中,所述视觉编码器,用于输入图像,输出视觉特征;所述语义编码器,用于输入文本,输出语义特征;所述多模融合模块,用于输入视觉特征和语义特征,输出融合视觉和语义的特征;所述分类模块,用于输入融合视觉和语义的特征,输出图像的分类结果。本申请的优势在于:不仅能够保持未见类别的总体分类精度在较高水平,还能有效降低整体模型的计算复杂度。
技术关键词
零样本图像分类
状态空间模型
语义特征
视觉特征
图像分类网络
融合视觉
前馈神经网络
图像分类模型
文本
模型训练模块
语义向量
参数
支路
训练集
系统为您推荐了相关专利信息
时间变化特征
动态监测方法
空间分布特征
语义特征
皮尔逊相关系数
知识图谱构建方法
语义特征
人机
分析工具
知识图谱构建系统
多层次语义特征
空间金字塔
缺陷类别
配网设备
加权特征
交通流量预测方法
历史交通数据
语义特征
多尺度特征融合
矩阵