摘要
本发明提供一种多模态小样本图像分类方法和装置,包括:获取预先建立的数据集;其中,数据集包括多个图像数据对,每个图像数据对包括一张图像和与该图像内容对应的类别名称;对数据集中的类别名称进行文本语义扩充,并基于扩充后的文本描述为每一图像生成对应的标注向量,得到多模态数据集;基于多模态数据集对预先建立的分类模型进行预训练,得到预训练分类模型;通过元学习策略训练预训练分类模型,得到图像分类模型;获取待分类的目标图像,将目标图像输入图像分类模型得到图像分类结果。本发明可充分利用长文本信息,不仅关注视觉特征的优化,还充分挖掘语义先验中的潜力,提升小样本图像分类的准确性,具有很大的应用前景。
技术关键词
训练分类模型
图像分类方法
图像分类模型
多模态
元学习策略
视觉特征
多层感知机
语义特征
样本
文本
数据
非暂态计算机可读存储介质
预训练语言模型
图像分类装置
分类器
分词
语义先验
标记
系统为您推荐了相关专利信息
交互系统
情绪状态信息
多模态信息
对话策略
识别模块
定位线夹
感兴趣区域提取
识别装置
接触网
特征提取模块
智能锁解锁方法
身份验证
面部识别
红外热像仪
局部邻域窗口
发电机励磁系统
水轮发电机励磁
系统故障预警方法
多模态传感器
三维温度场