摘要
本申请公开了一种图像多分类模型生成方法、装置、设备及存储介质,涉及计算机视觉技术领域,首先对公开数据集中的图像分配类别标签,组成图像集合,然后将图像集合中的图像划分为子块和缩略图,并分别经过特征提取之后送入编码器进行处理,构建分级跨模态注意力模块,之后将训练图像输入至分级跨模态注意力模块之后与编码提示进行拼接,输入特征提取网络模型和解码器得到解码输出,最后计算解码输出的交叉熵损失并加权求和,通过梯度下降优化模型参数得到图像多分类模型,利用该图像多分类模型能够实现高精度图像多分类。
技术关键词
分类模型生成方法
缩略图
编码特征
跨模态
图像
注意力
特征提取网络
标识符
编码器
模型生成装置
解码器
计算机视觉技术
计算机设备
标签
特征提取模块
参数
处理器
系统为您推荐了相关专利信息
音频特征信息
音频特征提取
高效识别方法
异常声音
数据
避障技术
模块
多模态融合技术
异常状态
控制智能机器人
扫描仪
放射学设备
工作流
医学成像数据
信号接收接口