一种零样本图像分类方法及装置

正文

推荐专利

一种零样本图像分类方法及装置

申请号：CN202411474911

申请日期：2024-10-22

公开号：CN119600643A

公开日期：2025-03-11

类型：发明专利

摘要

本发明公开了一种零样本图像分类方法及装置，属于图像识别领域。本发明通过大型语言模型生成类别描述文档，通过视觉编码器和文本编码器获取图像和文档的全局和局部特征信息，然后通过视觉语义分解模块和文本语义分解模块进行解耦，生成视觉语义嵌入和文本语义嵌入；通过上述模块的联合训练，并优化由局部到语义映射方差损失、多语义多样性损失、分解语义对齐损失和局部语义对齐损失组成的总损失；训练完成后用于推理阶段的图像类别预测。本发明可以降低零样本图像分类的难度，提高分类准确率和效率。

技术关键词

语义局部图像特征视觉零样本图像分类文本编码器交叉注意力机制代表局部特征信息模块图像分类模型矩阵分类准确率线性图像类别度函数

一种零样本图像分类方法及装置

站点导航

APP 下载