摘要
本发明公开了一种大语言模型压缩系统,该系统包括:链式分解模块,混合专家化模块,专家路由模块及多粒度训练模块;所述链式分解模块将原大语言模型中的大规模参数块W分解成行表示的链式矩阵乘的若干个第一矩阵[V1,V2,...,Vi,...,Vk];所述混合专家化模块将每个第一矩阵转化为以列表示的第二矩阵集[Vi1,Vi2,...,Vie],所述专家路由模块根据输入不同的矩阵在每个第二矩阵集计算构建矩阵因子;所述多粒度训练模块通过知识蒸馏将原大语言模型的数据信息转移到压缩矩阵中逐步训练原大语言模型转换成轻量化大语言模型;本发明克服了大语言模型参数量及存储空间占用大的问题,以及高倍压缩大语言模型时任务效果损失的问题。
技术关键词
大语言模型
矩阵
压缩系统
模块
蒸馏
因子
参数
分层
数据
线性
定义
基础
系统为您推荐了相关专利信息
变量
模型构建方法
大语言模型
作物生长状态
仿真平台
背光控制系统
显示屏模块
光驱模块
低功耗
分区板
温湿度控制方法
散热模组
露点温度
膨胀阀
电子除湿器