摘要
本发明公开了一种基于自适应温度的矢量匹配知识蒸馏方法及系统,方法包括以下步骤:S1、将图像输入给定的教师模型与学生模型,教师模型与学生模型中的神经网络分别对图像进行若干卷积处理,再通过全链接层处理,分别得到模型输出的逻辑回归logit,学生模型与教师模型的logit分别通过softmax函数提取概率分布特征,在提取概率分布特征后引入自适应温度机制,进行温度蒸馏;S2、提取教师模型与学生模型概率分布的矢量特征并引入余弦距离损失、交叉熵损失和KL散度损失计算总损失。本发明充分考虑了学生模型与教师模型的概率分布特性,将二者的矢量特征进行提取,扩展了知识蒸馏的特征体系,解决了知识蒸馏全局池化导致的类别不统一问题,大大降低了因为单一数据过度不匹配导致的蒸馏误差增大问题。
技术关键词
知识蒸馏方法
教师
学生
矢量特征
输出特征
标签
机制
样本
蒸馏系统
图像
逻辑
周期性
模块
规划
策略
算法
阶段
误差
系统为您推荐了相关专利信息
时间段
数据预测模型
电子校徽
学生
无线通信模块
编码器模块
多级特征融合
融合特征
乳腺肿瘤分割方法
形态
工业互联网
输出特征
频域特征提取方法
数据
节点
动态估计方法
时序特征
变量
输出解码器
高斯径向基函数