摘要
本发明公开了一种基于跨模态对齐和原型多样化的连续小样本图片分类方法,该方法包括:首先对输入图片添加视觉软提示提取图片特征,并将图片特征输入特征适配器获取优化后的图片特征,同时对类别标签添加文本软提示提取初步的类别文本原型;其次,将优化后的图片特征输入原型偏置器,对类别文本原型进行调整,从而获得融入视觉信息的类别文本原型;最后计算上述类别文本原型与图片特征之间的相似度,并将该输入图片预测为具有最大相似度的类别。本发明能够捕捉输入特异的视觉信息进行文本原型更正,有利于提升输入图片的分类精度;本发明实现方法简便、灵活,显著提高了新类别的预测精度,同时可以有效缓解模型在旧类别的灾难性遗忘现象。
技术关键词
图片分类方法
原型
跨模态
文本编码器
视觉
适配器
预测类别
样本
标签特征
图片分类装置
残差系数
多模态
处理器
参数
存储器
程序
系统为您推荐了相关专利信息
偏好特征
计算机程序产品
数据检索技术
文档生成模块
样本
无人机管理终端
数据
故障原因分析
日志
滤除噪声
超分辨率重建模型
深层特征提取
浅层特征提取
模块
注意力机制
动态位置编码
人工智能系统
量子态
注意力
深度学习模型
强化学习方法
视觉
强化学习算法
数据构造方法
图片