摘要
本申请提供一种图像分类方法、装置及可读存储介质,涉及人工智能技术领域。该图像分类方法包括:将待分类图像和第一文本输入至多模态基础模型,得到待分类图像对应的第一图像特征和第一文本对应的第一文本特征,第一文本用于指示所述待分类图像的图像局部信息,且多模态基础模型具有零样本分类能力;将第一图像特征和第一文本特征输入至目标多层感知机模型,得到第一预测结果,第一预测结果包括所述目标多层感知机模型预测的所述待分类图像属于N个预设图像类别的概率,目标多层感知机模型用于对第一图像特征和第一文本特征进行特征转换、特征融合以及图像分类处理;根据所述第一预测结果,确定所述待分类图像的图像类别。
技术关键词
多层感知机
图像类别
图像分类方法
文本
融合特征
子模块
图像分类设备
图像分类装置
多模态
人工智能技术
基础
处理器
程序
指令
样本
可读存储介质
收发器
存储器
系统为您推荐了相关专利信息
行人重识别模型
重识别方法
多模态
图像编码器
离散小波变换
弯曲传感器
角度识别方法
金属电极
薄膜传感器
微结构
车辆轨迹预测方法
融合特征
协方差矩阵
车辆运动状态参数
转向灯开关
储能设施
监测单元
监管方法
火灾监管系统
大数据