图像分类方法、装置及可读存储介质

正文

推荐专利

图像分类方法、装置及可读存储介质

申请号：CN202410835678

申请日期：2024-06-26

公开号：CN118799633A

公开日期：2024-10-18

类型：发明专利

摘要

本申请提供一种图像分类方法、装置及可读存储介质，涉及人工智能技术领域。该图像分类方法包括：将待分类图像和第一文本输入至多模态基础模型，得到待分类图像对应的第一图像特征和第一文本对应的第一文本特征，第一文本用于指示所述待分类图像的图像局部信息，且多模态基础模型具有零样本分类能力；将第一图像特征和第一文本特征输入至目标多层感知机模型，得到第一预测结果，第一预测结果包括所述目标多层感知机模型预测的所述待分类图像属于N个预设图像类别的概率，目标多层感知机模型用于对第一图像特征和第一文本特征进行特征转换、特征融合以及图像分类处理；根据所述第一预测结果，确定所述待分类图像的图像类别。

技术关键词

多层感知机图像类别图像分类方法文本融合特征子模块图像分类设备图像分类装置多模态人工智能技术基础处理器程序指令样本可读存储介质收发器存储器

系统为您推荐了相关专利信息

基于多模态提示增强的行人重识别方法及装置

行人重识别模型重识别方法多模态图像编码器离散小波变换

用于薄膜弯曲传感器数据增强的角度识别方法及设备

弯曲传感器角度识别方法金属电极薄膜传感器微结构

一种车辆轨迹预测方法、系统、设备及存储介质

车辆轨迹预测方法融合特征协方差矩阵车辆运动状态参数转向灯开关

一种基于大语言模型的近实时风险语料生成方法

语料生成方法大语言模型风险事件名数据

基于大数据的电化学储能设施火灾监管系统及方法

储能设施监测单元监管方法火灾监管系统大数据

图像分类方法、装置及可读存储介质

站点导航

APP 下载