针对低算力设备的大模型端到端蒸馏部署方法、装置、设备及介质

正文

推荐专利

申请号：CN202510542975

申请日期：2025-04-28

公开号：CN120066803B

公开日期：2025-07-29

类型：发明专利

摘要

本申请公开了针对低算力设备的大模型端到端蒸馏部署方法、装置、设备及介质，涉及人工智能领域，包括：在计算集群中，确定第一目标数据集和目标学生模型，并部署蒸馏模型训练框架；利用第一预设大模型推理框架将预设大语言模型部署至计算集群，并将部署后的预设大语言模型确定为教师模型；若蒸馏模型训练框架为黑盒知识蒸馏框架，则基于教师模型和第一目标数据集确定第二目标数据集，并利用第二目标数据集对目标学生模型进行蒸馏，以得到蒸馏模型；若蒸馏模型训练框架为白盒知识蒸馏框架，则基于教师模型对目标学生模型进行蒸馏，以得到蒸馏模型；基于第二预设大模型推理框架将蒸馏模型部署至目标设备。因此，能够提高对大语言模型访问的效率。

技术关键词

大语言模型蒸馏框架教师学生集群注意力机制字符生成速度显卡数据分类中间层模型库缩放技术权重算法指标标签模块

针对低算力设备的大模型端到端蒸馏部署方法、装置、设备及介质

站点导航

APP 下载