一种基于知识蒸馏的模型压缩方法及系统

正文

推荐专利

一种基于知识蒸馏的模型压缩方法及系统

申请号：CN202510994462

申请日期：2025-07-18

公开号：CN120806057A

公开日期：2025-10-17

类型：发明专利

摘要

本发明提供了一种基于知识蒸馏的模型压缩方法及系统，通过继承已经训练成熟的教师模型的软标签，并使用软标签定义学生模型的蒸馏损失函数，使得学生模型得以压缩，在此基础上，通过随机抽取样本混合生成新的样本扩展训练集，缓解数据不足问题，同时提升模型对噪声和分布偏移的鲁棒性，通过动态权重调整，使学生模型迅速拟合教师模型知识，在训练后期自主优化，避免过拟合软标签。通过在未标注数据占比30%的测试集上，在使用真实标签的准确率为78.3%基础上，使用伪目标使准确率提升11.2%，通过使用训练成熟的学生模型进行部署，省略中间层特征对齐，GPU显存占用从3.2GB降至1.8GB，满足边缘设备部署需求。

技术关键词

模型压缩方法蒸馏学生样本教师标签训练集定义数据鲁棒性中间层动态索引策略噪声线性基础参数

系统为您推荐了相关专利信息

一种结直肠癌预后预测模型构建方法、系统、设备及介质

预后预测模型基因表达数据结直肠癌患者高风险富集

多加样针液面探测方法

液面探测方法电容液面探测电路表达式样本

变电站的负荷预测方法、电子设备及计算机产品

负荷预测方法样本负荷预测模型数据偏差

一种基于改进SABO算法的热泵控制系统辨识方法

热泵控制系统辨识方法系统辨识模型系统参数辨识多项式

音频识别方法、系统、电子设备及存储介质

音频识别方法说话人数目声纹特征声学特征训练识别模型

一种基于知识蒸馏的模型压缩方法及系统

站点导航

APP 下载