一种用于提升Logit知识蒸馏的预处理方法

正文

推荐专利

申请号：CN202411850671

申请日期：2024-12-16

公开号：CN119808884A

公开日期：2025-04-11

类型：发明专利

摘要

本发明公开了一种用于提升Logit知识蒸馏的预处理方法，涉及计算机视觉和深度学习技术领域。本发明旨在解决传统知识蒸馏中存在的关键问题。在传统知识蒸馏中，采用固定温度将软标签从教师模型迁移至学生模型时，学生对每个样本的学习权重均相同，这极大地限制了学生模型性能的进一步提升。针对这一状况，本发明首先对教师模型与学生模型的输出进行处理，提高较高分数部分的值并降低较低分数部分的值，形成双向拉伸效果。然后利用Z‑score标准化方式，依据数据的均值与标准差，将数据转换为标准正态分布，从而实现教师模型与学生模型输出的精确匹配，以促进学生模型性能的优化。

技术关键词

学生教师蒸馏样本标准化方法深度学习技术模型预测值标签计算机视觉数据分布网络分类器图像

系统为您推荐了相关专利信息

热导率预测方法、装置、计算机设备和存储介质

晶体样本计算机设备预测装置网格

一种基于多维度综合分析的目标识别智能算法可信评估方法

智能算法鲁棒性精度指标样本

一种基于气候指数的覆冰趋势预测方法

长期趋势预测方法指数协方差矩阵气候电力系统防灾减灾技术

基于对抗神经网络和迁移学习的伴流场预测方法及设备

物理样本参数船舶设计技术统计特征

基于粪菌移植治疗克罗恩病的微生物标志物及筛选方法

标志物筛选方法建立预测模型检测肠道机器学习算法样本

一种用于提升Logit知识蒸馏的预处理方法

站点导航

APP 下载