一种基于参数共享和知识蒸馏的大模型小型化方法

AITNT
正文
推荐专利
一种基于参数共享和知识蒸馏的大模型小型化方法
申请号:CN202510345060
申请日期:2025-03-24
公开号:CN120258087A
公开日期:2025-07-04
类型:发明专利
摘要
本发明公开了一种基于参数共享和知识蒸馏的大模型小型化方法,首先进行数据准备:准备训练数据集和测试数据集;然后进行教师模型选择:选择一个预训练的大模型作为教师模型和学生模型的初始模型;接着进行学生模型构建:构建一个参数量更少的学生模型;最后知识蒸馏训练:使用教师模型对学生模型进行知识蒸馏训练,最小化损失函数。本发明能够有效地将大模型压缩为小型模型,同时保持较高的性能,具有广泛的应用前景。
技术关键词
小型化方法 教师 学生 协方差矩阵 蒸馏 重构误差 参数 模型压缩 学习特征 数据 定义 编码器 复杂度 关系 语义 规模 因子 线性
系统为您推荐了相关专利信息
1
一种知识图谱课程教学方法及系统
个性化学习路径 学生 教学方法 构建知识图谱 知识图谱构建
2
基于多尺度超像素的SAR地物样本自动提取方法、系统、存储介质和电子设备
多尺度超像素 高分辨率SAR影像 土地覆盖分类 极化SAR数据 拓扑网络
3
基于消除记忆递推最小二乘法的电池的荷电状态估计方法
递推最小二乘法 状态估计方法 记忆 电池模型参数 协方差矩阵
4
一种林木养护机器人喷涂装置的视觉伺服运动规划方法
机器人喷涂装置 运动规划方法 协方差矩阵 林木 空间聚类算法
5
带弱电控制的箱变数据传输故障诊断方法及系统
故障诊断方法 干扰特征 故障预测模型 弱电控制系统 物理
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号