基于知识蒸馏的模型轻量化方法

正文

推荐专利

基于知识蒸馏的模型轻量化方法

申请号：CN202510967538

申请日期：2025-07-14

公开号：CN120688580A

公开日期：2025-09-23

类型：发明专利

摘要

本发明公开了一种基于知识蒸馏的模型轻量化方法，通过将多个复杂模型产生的软标签作为训练数据，训练一个较小的模型，这个小模型能够模拟大模型的行为。实验表明，使用知识蒸馏的方法，不仅能够在保持相似性能的同时显著减少计算开销，而且能够使得小模型在某些情况下超越单一的大模型；本方法通过将大模型的知识传递到小模型中，知识蒸馏方法能够使小模型达到与大模型相似的表现，同时大幅度减少计算资源消耗，使小模型在处理速度和内存消耗上都具备了更高的效率。

技术关键词

轻量化方法教师标签知识蒸馏方法学生神经网络模型数据参数内存元素关系

系统为您推荐了相关专利信息

一种点状滑坡泥石流潜势度自适应监测预警方法

预警规则图谱动态滑坡泥石流分类规则

一种基于人工智能的动态路由配置方法及系统

画像误差系数编码标签数据

面向视觉语言模型的模型推理方法、装置、设备及介质

视觉实体掩码策略推理方法文本

电路分析方法以及电子设备

电路分析方法元器件深度学习模型生成训练样本电路分析技术

融合语义大模型的短信内容合规生成方法及系统

语义解析信息融合语义短信生成方法依赖关系分析

基于知识蒸馏的模型轻量化方法

站点导航

APP 下载