摘要
本申请实施例提供了一种图像分类方法、电子设备及计算机可读存储介质,涉及人工智能技术领域。该方法包括:将第一样本图像输入预训练视觉语言模型进行文本生成,得到第一样本图像文本描述;为第一样本图像文本描述增加问题引导语,然后输入第一初始大语言模型进行类别预测,得到第一样本预测图像类别;基于真实图像类别和第一样本预测图像类别对初始大语言模型进行微调,得到第一目标大语言模型;将第一目标图像输入预训练视觉语言模型进行文本生成,得到第一目标图像文本描述;为第一目标图像文本描述增加问题引导语,然后输入第一目标大语言模型进行类别预测,得到第一目标预测图像类别。本申请提高了图像分类准确性。
技术关键词
图像类别
大语言模型
样本
预测类别
图像分类方法
视觉
标签模型
字幕
预训练语言模型
可读存储介质
电子设备
标签模板
标签文本
人工智能技术
生成标签
数据
系统为您推荐了相关专利信息
医学图像分类方法
节点特征
图像编码器
跨模态融合特征
医学图像数据集
图像分析软件
卷积神经网络模型
管理方法
像素点
矩阵
大语言模型
翻译语言
答案
计算机程序指令
语义向量
特征提取模型
故障预测模型
拼接模型
服务器系统
历史运行数据