摘要
本发明涉及一种基于提示引导的零样本图像分类方法及系统,涉及计算机视觉人工智能技术领域。方法包括:根据全局语义表示、实例提示表示和实例视觉表示计算得到增强视觉表示、所有类别的属性的相似度分数、分类模型优化的总损失,将所述总损失作为优化目标,优化分类模型的参数;根据优化后的分类模型计算所给图像与不可见类别的属性之间的相似度分数,输出图像对应的预测标签,实现零样本图像的分类。本方法能够在没有可训练的图像样本的场景下,充分利用文本语义提示和属性向量进行自动图像分类,保证了实例级语义信息和实例级视觉信息可靠的跨模态交流,提高了图像分类的精度。
技术关键词
语义
视觉
分类模型优化
解码器
图像分类方法
跨模态
标签
全局平均池化
文本编码器
样本
图像分类系统
模块
注意力
校准
因子
参数
系统为您推荐了相关专利信息
焊接机器人
多模态传感器
卡尔曼滤波算法
数字孪生体
仿真模型
智能控制方法
机械臂
预测机械
长短记忆网络
动态
决策分析系统
交互特征
大数据
sigmoid函数
矩阵