一种图像多分类模型生成方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202411724739

申请日期：2024-11-28

公开号：CN119204144B

公开日期：2025-04-08

类型：发明专利

摘要

本申请公开了一种图像多分类模型生成方法、装置、设备及存储介质，涉及计算机视觉技术领域，首先对公开数据集中的图像分配类别标签，组成图像集合，然后将图像集合中的图像划分为子块和缩略图，并分别经过特征提取之后送入编码器进行处理，构建分级跨模态注意力模块，之后将训练图像输入至分级跨模态注意力模块之后与编码提示进行拼接，输入特征提取网络模型和解码器得到解码输出，最后计算解码输出的交叉熵损失并加权求和，通过梯度下降优化模型参数得到图像多分类模型，利用该图像多分类模型能够实现高精度图像多分类。

技术关键词

分类模型生成方法缩略图编码特征跨模态图像注意力特征提取网络标识符编码器模型生成装置解码器计算机视觉技术计算机设备标签特征提取模块参数处理器

系统为您推荐了相关专利信息

一种基于对象感知和上下文对比学习的LVM引导的红外和可见光图像融合方法

可见光图像样本模态特征融合特征注意力

一种气道分泌物的高效识别方法和系统

音频特征信息音频特征提取高效识别方法异常声音数据

一种结合机器学习的骨肿瘤热消融治疗控制装置

编码向量通道图像分割语义图像增强模块

智能机器人

避障技术模块多模态融合技术异常状态控制智能机器人

用于针对放射学设备机群内诸如医疗扫描仪的放射学设备提供关于工作流的控制信号的技术

扫描仪放射学设备工作流医学成像数据信号接收接口

一种图像多分类模型生成方法、装置、设备及存储介质

站点导航

APP 下载