摘要
本发明涉及一种基于知识蒸馏的目标检测模型的训练方法,属于目标检测领域。包括:构建训练数据集及目标检测模型,基于训练数据集对目标检测模型进行训练输出推理图;计算第一损失函数得到训练后的目标检测模型,将其作为教师模型;将教师模型的参数进行简化得到学生模型;基于训练数据集得到第二训练数据集,基于第二训练数据集对教师模型及学生模型进行训练分别输出预测标签;计算第二损失函数得到训练好的学生模型作为训练好的目标检测模型。该方法采用差分变异算法得到最优的蒸馏温度及损失系数,通过知识蒸馏训练学生模型得到训练好的目标检测模型,解决了现有目标检测模型在少量样本训练的情况下,导致检测精度低的问题。
技术关键词
网络结构
学生
蒸馏
标签
教师
表达式
样本
数据
检测端
误差
参数
代表
算法
精度
输入端
图像
通道