摘要
本发明实施例提供了一种VIT模型训练、图像分类方法。上述方法包括:获取第一样本图像;针对第一样本图像的每一第一窗口,从该第一窗口中去除第一数量个第一token,并将剩余的第一token作为第一模型输入结果;将第一模型输入结果输入至原始VIT模型,得到原始VIT模型输出的第一分类结果;基于第一分类结果以及第一样本图像对应的第一样本标签,计算第一目标损失;根据目标损失调整原始VIT模型的模型参数,返回从将第一模型输入结果输入至原始VIT模型,得到原始VIT模型输出的第一分类结果的步骤起继续执行,直至满足预设收敛条件,得到训练后的VIT模型。应用本发明实施例提供的方案能够提高VIT模型的推理效率。
技术关键词
样本
图像分类方法
标签
通信接口
输入模块
存储器
转换器
图像分类装置
处理器
模型训练装置
模型训练方法
参数
图像获取模块
可读存储介质
视觉
电子设备
计算机
矩阵
系统为您推荐了相关专利信息
缺陷类别
半导体缺陷检测
模型训练方法
半导体晶圆缺陷
图像
模型压缩方法
非暂态计算机可读存储介质
Softmax函数
蒸馏
处理器
大语言模型
语义标签
节点
语义图谱
可配置工作流