摘要
本申请公开了一种针对持续学习的数据蒸馏模型训练方法、装置及设备,涉及人工智能领域。具体实现方案包括:获取第一图像分类模型;将第一待蒸馏样本对应的预测概率分布向量输入目标蒸馏网络,得到包含有丰富类别信息量的第一分类软标签;基于第二任务样本集、第一待蒸馏样本、第一分类软标签,对第一图像分类模型进行迭代训练,得到在旧任务上性能更好的第二图像分类模型。本公开能够解决现有技术在持续学习场景下通过数据蒸馏方式仍会忽略新旧任务之间的关系,导致图像分类模型在旧任务上图像分类性能较差的问题,提高图像分类模型在旧任务上的性能。
技术关键词
图像分类模型
蒸馏
样本
模型训练方法
标签
内存
网络
图像类别
数据
模型训练装置
参数
处理器
关系
指标
模块
指令
精度
存储器
场景