摘要
本发明公开了一种基于零样本学习的图像分类方法,方法包括以下步骤:首先搭建图像分类系统,采用可见类数据集为训练集,不可见类数据集为测试集,通过CNN视觉骨干和GloVe获得视觉全局与语义特征。然后从视觉和语义特征中提取不同维度特征并融合成多元高维度融合视觉特征。之后,用映射函数将融合视觉特征映射到语义空间,得语义嵌入并由优化模块优化。训练完后,获取测试实例语义嵌入,利用最近邻匹配与显式自校准预测标签,通过计算测试样本语义嵌入和类别语义向量点积,选兼容性得分最高类别作预测类别。本发明可以解决在零样本分类中不同维度特征考虑不充足的问题,确保对可见和不可见类的预测分布一致性,提高对不可见类的泛化能力。
技术关键词
融合视觉特征
图像分类方法
语义特征
交互特征
语义向量
图像分类系统
样本
局部特征提取
特征提取模块
混合特征提取
预测类别
视觉特征提取
全局特征提取
代表
标签
训练集
系统为您推荐了相关专利信息
日志异常检测方法
GRU模型
序列
词嵌入向量
模板
飞行状态数据
固定翼无人机
协方差矩阵
语义分割模型
误差向量
设备故障分析方法
神经网络模型
数字孪生模型
噪声数据
多模态