一种基于提示引导的零样本图像分类方法及系统

正文

推荐专利

申请号：CN202410853614

申请日期：2024-06-28

公开号：CN118691898A

公开日期：2024-09-24

类型：发明专利

摘要

本发明涉及一种基于提示引导的零样本图像分类方法及系统，涉及计算机视觉人工智能技术领域。方法包括：根据全局语义表示、实例提示表示和实例视觉表示计算得到增强视觉表示、所有类别的属性的相似度分数、分类模型优化的总损失，将所述总损失作为优化目标，优化分类模型的参数；根据优化后的分类模型计算所给图像与不可见类别的属性之间的相似度分数，输出图像对应的预测标签，实现零样本图像的分类。本方法能够在没有可训练的图像样本的场景下，充分利用文本语义提示和属性向量进行自动图像分类，保证了实例级语义信息和实例级视觉信息可靠的跨模态交流，提高了图像分类的精度。

技术关键词

语义视觉分类模型优化解码器图像分类方法跨模态标签全局平均池化文本编码器样本图像分类系统模块注意力校准因子参数

系统为您推荐了相关专利信息

文生图场景下的模型训练方法、装置、设备及介质

文本模型训练方法图文编辑样本

一种基于数字孪生的焊接机器人自适应控制系统及方法

焊接机器人多模态传感器卡尔曼滤波算法数字孪生体仿真模型

一种利用传感器数据进行塔吊定位的方法

塔吊标志物信号回转机构吊臂

全自动下板的智能控制方法及系统

智能控制方法机械臂预测机械长短记忆网络动态

基于大数据的企业智能决策分析系统及方法

决策分析系统交互特征大数据 sigmoid函数矩阵

一种基于提示引导的零样本图像分类方法及系统

站点导航

APP 下载