摘要
本申请公开了一种知识蒸馏方法、装置、设备、存储介质及程序产品,其中,方法包括:对目标样本集训练生成的第一教师模型进行模型压缩,得到第一学生模型;其中,第一学生模型的模型参数量小于第一教师模型的模型参数量;对第一学生模型输出的第一特征图进行随机掩码,得到第一掩码特征图;对第一掩码特征图进行特征重建,得到第一重建特征图;基于第一重建特征图和第一教师模型输出的第二特征图之间的差异,确定第一蒸馏损失;基于第一蒸馏损失和第一学生模型的第一预测损失,确定第一损失函数;基于第一损失函数对第一学生模型进行优化,并基于目标样本集对优化后的第一学生模型进行性能测试;其中,第一教师模型和第一学生模型用于目标检测任务。
技术关键词
学生
教师
模型压缩
知识蒸馏方法
样本
存储计算机程序
处理单元
蒸馏装置
非线性
存储器
元素
参数
可读存储介质
处理器
尺寸
系统为您推荐了相关专利信息
大语言模型
面向旋转机械
旋转机械故障诊断
矩阵
文本
智能调制识别方法
密度
搜索算法
频率
特征提取模块
土层边坡
双滑动面
搜索方法
三维实景模型
强度折减法
矩阵
大语言模型
文本处理方法
文本处理装置
滑动窗口
高分辨率遥感影像
变化检测模型
变化检测方法
特征金字塔
像素