一种基于提示引导的零样本图像分类方法及系统

AITNT
正文
推荐专利
一种基于提示引导的零样本图像分类方法及系统
申请号:CN202410857514
申请日期:2024-06-28
公开号:CN118691899B
公开日期:2025-07-15
类型:发明专利
摘要
本发明涉及一种基于提示引导的零样本图像分类方法及系统,涉及计算机视觉人工智能技术领域。方法包括:根据全局语义表示、实例提示表示和实例视觉表示计算得到增强视觉表示、所有类别的属性的相似度分数、分类模型优化的总损失,将所述总损失作为优化目标,优化分类模型的参数;根据优化后的分类模型计算所给图像与不可见类别的属性之间的相似度分数,输出图像对应的预测标签,实现零样本图像的分类。本方法能够在没有可训练的图像样本的场景下,充分利用文本语义提示和属性向量进行自动图像分类,保证了实例级语义信息和实例级视觉信息可靠的跨模态交流,提高了图像分类的精度。
技术关键词
语义 视觉 分类模型优化 跨模态 解码器 图像分类方法 全局平均池化 文本编码器 样本 模块 图像分类系统 标签 注意力 因子 参数 数据
系统为您推荐了相关专利信息
1
一种神经外科手术机器人视觉伺服控制方法、装置及存储介质
神经外科手术 机器人末端工具 阻尼系统 机器人视觉伺服控制 视觉伺服控制方法
2
结构化查询语句的错误识别方法、装置、设备及存储介质
结构化查询语句 查询意图 错误识别方法 关系 错误识别装置
3
基于三分支结构的多尺度实时语义分割方法及系统
三分支结构 语义分割方法 残差模块 注意力 语义分割系统
4
基于图像语义分割的黄土湿陷性的评价计算方法
评价计算方法 图像语义分割 孔隙结构 黄土 监测单元
5
一种高精度视觉对位贴合方法
对位贴合方法 三维点云数据 高精度视觉 柔性 工件
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号