图像分类方法、装置及可读存储介质

AITNT
正文
推荐专利
图像分类方法、装置及可读存储介质
申请号:CN202410835678
申请日期:2024-06-26
公开号:CN118799633A
公开日期:2024-10-18
类型:发明专利
摘要
本申请提供一种图像分类方法、装置及可读存储介质,涉及人工智能技术领域。该图像分类方法包括:将待分类图像和第一文本输入至多模态基础模型,得到待分类图像对应的第一图像特征和第一文本对应的第一文本特征,第一文本用于指示所述待分类图像的图像局部信息,且多模态基础模型具有零样本分类能力;将第一图像特征和第一文本特征输入至目标多层感知机模型,得到第一预测结果,第一预测结果包括所述目标多层感知机模型预测的所述待分类图像属于N个预设图像类别的概率,目标多层感知机模型用于对第一图像特征和第一文本特征进行特征转换、特征融合以及图像分类处理;根据所述第一预测结果,确定所述待分类图像的图像类别。
技术关键词
多层感知机 图像类别 图像分类方法 文本 融合特征 子模块 图像分类设备 图像分类装置 多模态 人工智能技术 基础 处理器 程序 指令 样本 可读存储介质 收发器 存储器
系统为您推荐了相关专利信息
1
基于多模态提示增强的行人重识别方法及装置
行人重识别模型 重识别方法 多模态 图像编码器 离散小波变换
2
用于薄膜弯曲传感器数据增强的角度识别方法及设备
弯曲传感器 角度识别方法 金属电极 薄膜传感器 微结构
3
一种车辆轨迹预测方法、系统、设备及存储介质
车辆轨迹预测方法 融合特征 协方差矩阵 车辆运动状态参数 转向灯开关
4
一种基于大语言模型的近实时风险语料生成方法
语料生成方法 大语言模型 风险 事件名 数据
5
基于大数据的电化学储能设施火灾监管系统及方法
储能设施 监测单元 监管方法 火灾监管系统 大数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号