一种基于参数共享和知识蒸馏的大模型小型化方法

正文

推荐专利

申请号：CN202510345060

申请日期：2025-03-24

公开号：CN120258087A

公开日期：2025-07-04

类型：发明专利

摘要

本发明公开了一种基于参数共享和知识蒸馏的大模型小型化方法，首先进行数据准备：准备训练数据集和测试数据集；然后进行教师模型选择：选择一个预训练的大模型作为教师模型和学生模型的初始模型；接着进行学生模型构建：构建一个参数量更少的学生模型；最后知识蒸馏训练：使用教师模型对学生模型进行知识蒸馏训练，最小化损失函数。本发明能够有效地将大模型压缩为小型模型，同时保持较高的性能，具有广泛的应用前景。

技术关键词

小型化方法教师学生协方差矩阵蒸馏重构误差参数模型压缩学习特征数据定义编码器复杂度关系语义规模因子线性

系统为您推荐了相关专利信息

一种知识图谱课程教学方法及系统

个性化学习路径学生教学方法构建知识图谱知识图谱构建

基于多尺度超像素的SAR地物样本自动提取方法、系统、存储介质和电子设备

多尺度超像素高分辨率SAR影像土地覆盖分类极化SAR数据拓扑网络

基于消除记忆递推最小二乘法的电池的荷电状态估计方法

递推最小二乘法状态估计方法记忆电池模型参数协方差矩阵

一种林木养护机器人喷涂装置的视觉伺服运动规划方法

机器人喷涂装置运动规划方法协方差矩阵林木空间聚类算法

带弱电控制的箱变数据传输故障诊断方法及系统

故障诊断方法干扰特征故障预测模型弱电控制系统物理

一种基于参数共享和知识蒸馏的大模型小型化方法

站点导航

APP 下载