基于教师模型输出重构的知识蒸馏方法

AITNT
正文
推荐专利
基于教师模型输出重构的知识蒸馏方法
申请号:CN202411654869
申请日期:2024-11-19
公开号:CN119150963A
公开日期:2024-12-17
类型:发明专利
摘要
本发明涉及机器学习领域,具体为基于教师模型输出重构的知识蒸馏方法,对数据集预处理,得到能够直接输入教师模型的预处理数据集,并输入教师模型和学生模型,分别得到教师模型和学生模型各自对应的分类结果和输出logit,以此得到教师模型修正后的输出logit的概率分布以及非目标类别概率分布,以及学生模型的输出logit的概率分布;基于教师模型修正后的输出logit的概率分布以及非目标类别概率分布,与学生模型的输出logit的概率分布,进行知识蒸馏,对学生模型进行训练,从而得到所需的学生模型。本发明能够对教师模型输出概率分布进行重构,提高知识质量,完善知识类型,使得学生模型学习更加准确,优化模型压缩性能,有利于增强学生模型的泛化能力。
技术关键词
教师 学生 知识蒸馏方法 数据 样本 随机梯度下降 重构 模型压缩 神经网络模型 标签 规模 优化器 图像 标识
系统为您推荐了相关专利信息
1
一种利用几何反演技术的有色金属矿产探井部署决策方法
反演技术 决策方法 展布规律 数据 代表
2
一种新能源锂离子电池管理系统
新能源锂离子电池 管理系统 策略 新能源汽车 多模态
3
基于转账资金链路的风险识别处置方法及装置
账户 资金 链路 时间段 风险
4
半导体湿洗设备故障预测方法
故障预测模型 湿洗设备 故障预测方法 湿法设备 降噪自动编码器
5
基于儿童特征表现的膳食搭配方法及系统
搭配方法 对象 动态规划算法 阶段 线性规划算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号