一种VIT模型训练、图像分类方法

正文

推荐专利

一种VIT模型训练、图像分类方法

申请号：CN202411518064

申请日期：2024-10-29

公开号：CN119314004A

公开日期：2025-01-14

类型：发明专利

摘要

本发明实施例提供了一种VIT模型训练、图像分类方法。上述方法包括：获取第一样本图像；针对第一样本图像的每一第一窗口，从该第一窗口中去除第一数量个第一token，并将剩余的第一token作为第一模型输入结果；将第一模型输入结果输入至原始VIT模型，得到原始VIT模型输出的第一分类结果；基于第一分类结果以及第一样本图像对应的第一样本标签，计算第一目标损失；根据目标损失调整原始VIT模型的模型参数，返回从将第一模型输入结果输入至原始VIT模型，得到原始VIT模型输出的第一分类结果的步骤起继续执行，直至满足预设收敛条件，得到训练后的VIT模型。应用本发明实施例提供的方案能够提高VIT模型的推理效率。

技术关键词

样本图像分类方法标签通信接口输入模块存储器转换器图像分类装置处理器模型训练装置模型训练方法参数图像获取模块可读存储介质视觉电子设备计算机矩阵

系统为您推荐了相关专利信息

两化融合分析报告生成方法、装置、电子设备和存储介质

分析报告生成方法布局文本大语言模型元素

半导体缺陷检测模型训练方法及半导体缺陷检测方法

缺陷类别半导体缺陷检测模型训练方法半导体晶圆缺陷图像

一种基于可微架构搜索的任务自适应ViT模型压缩方法

模型压缩方法非暂态计算机可读存储介质 Softmax函数蒸馏处理器

基于可配置工作流和领域知识库的大模型应用构建方法

大语言模型语义标签节点语义图谱可配置工作流

基于WBS技术的洁净房施工优化方法

洁净房施工优化方法样本度量密度

一种VIT模型训练、图像分类方法

站点导航

APP 下载