一种基于transformer神经网络的图像分类方法

正文

推荐专利

申请号：CN202510493850

申请日期：2025-04-19

公开号：CN120375080A

公开日期：2025-07-25

类型：发明专利

摘要

本发明公开了一种基于Transformer神经网络的图像分类方法，属于图像分类领域，涉及Transformer神经网络技术，包括以下步骤：获取输入图像，使用Sobel算子分别计算输入图像中每个像素的梯度幅值分量；根据所述梯度幅值分量计算输入图像的梯度变异值，并根据所述梯度变异值对输入图像进行动态自适应分块；将所述分块展平为向量序列，根据预训练的ViT模型扩展线性投影层权重，并通过线性投影层将所述向量序列线性投影为d维嵌入向量；为所述嵌入向量加入位置编码并生成特征向量；根据所述动态自适应分块的类型，使用Transformer的多头注意力机制或跨尺度交叉注意力机制对所述特征向量进行处理，输出所述输入图像的类别概率分布；本发明能够平衡图像分类的效率与精度。

技术关键词

图像分类方法交叉注意力机制多头注意力机制生成特征向量幅值分块特征像素 Softmax函数序列令牌线性神经网络技术动态通道全局平均池化编码分阶段预训练模型

系统为您推荐了相关专利信息

一种基于数据驱动的色纺纱颜色预测方法和系统

系统控制参数产品规格参数棉纤维颜色纱线融合特征

一种基于物联网的老人语音应急求救方法及系统

应急求救方法语音患者深度神经网络模型数值

基于物理约束和语义形状推断的红外图像对抗生成方法

语义生成方法物理随机噪声发射率

一种体检智能分流方法、装置、设备及存储介质

智能分流方法体检机构项目机器学习模型非暂态计算机可读存储介质

人工林碳汇监测报告自动生成系统及方法

生成特征向量二氧化碳监测仪自动生成系统编码向量特征提取单元

一种基于transformer神经网络的图像分类方法

站点导航

APP 下载