摘要
本发明提供了一种用于训练图像分类模型的方法,包括:获取当前批次的样本,该批次的样本构成的集合具有长尾分布的性质;将当前批次的样本图像输入模型,利用模型参数确定输入图像的第一分类预测值,根据第一分类预测值、标签和总损失函数确定第一梯度,总损失函数为原始损失函数减去加权系数乘以锐度优化损失函数;根据当前批次中属于每个类别的样本图像对应的第一分类预测值和标签,确定模型参数对应的扰动;将模型参数与扰动相加,得到扰动参数;将当前批次的样本图像输入模型,利用模型的扰动参数确定输入图像的第二分类预测值,根据第二分类预测值、标签和锐度优化损失函数,确定第二梯度;根据第一梯度和第二梯度,更新所述模型参数。
技术关键词
训练图像分类模型
样本
标签
图像分类方法
更新模型参数
计算机程序产品
处理器
指令
超参数
可读存储介质
存储器
训练集
电子设备
数据
系统为您推荐了相关专利信息
智能预测方法
刚度
位置更新
混合方法
粒子群优化算法
拷贝数
样本
基因组测序数据
磁珠纯化
无创产前胎儿
智能家居节点
智能交互系统
指令
地理位置信息
大数据
大语言模型
多模态
训练样本集
计算机程序代码
图像
墙体杂波抑制方法
穿墙雷达
更新模型参数
雷达仿真
残差学习