摘要
本发明涉及图像处理技术领域,提出了一种基于大模型跨模态语义先验的小样本图像分类方法及系统,包括获取待分类图像对应的支持图像及类别名称,通过跨模态迭代提示生成每个类别对应的文本描述,然后,通过零样本方式合成与文本描述语义一致的合成图像,选取匹配度高于设定值的合成图像与原支持图像构成扩充后的支持集;将文本描述进行编码得到文本先验特征;基于文本先验特征对提取的支持图像特征进行增强;基于增强后的支持图像特征以及扩充后的支持集得到分类原型,进而得到分类结果;通过创新的跨模态迭代提示(CIP)和跨模态几何对齐(CGA),显著提升了小样本分类的泛化和对齐效果。
技术关键词
图像分类方法
语义先验
跨模态
原型
样本
图像生成模型
文本编码器
拼接模块
图像分类系统
视觉特征
多头注意力机制
分支
三元组
计算机
图像处理技术
系统为您推荐了相关专利信息
机械故障诊断方法
振动信号特征提取
异构特征
特征提取器
诊断机械设备
污水处理工艺
随机森林
狼群优化
编码器
生成对抗网络
协同过滤推荐模型
样本
个性化商品推荐方法
采样方法
电商
光学模组
缺陷检测方法
机器学习模型
振动特征
分类准确率
早期预警系统
故障知识库
故障诊断模块
模型训练模块
数据采集模块