一种大语言模型压缩系统

AITNT
正文
推荐专利
一种大语言模型压缩系统
申请号:CN202510325734
申请日期:2025-03-19
公开号:CN120258074A
公开日期:2025-07-04
类型:发明专利
摘要
本发明公开了一种大语言模型压缩系统,该系统包括:链式分解模块,混合专家化模块,专家路由模块及多粒度训练模块;所述链式分解模块将原大语言模型中的大规模参数块W分解成行表示的链式矩阵乘的若干个第一矩阵[V1,V2,...,Vi,...,Vk];所述混合专家化模块将每个第一矩阵转化为以列表示的第二矩阵集[Vi1,Vi2,...,Vie],所述专家路由模块根据输入不同的矩阵在每个第二矩阵集计算构建矩阵因子;所述多粒度训练模块通过知识蒸馏将原大语言模型的数据信息转移到压缩矩阵中逐步训练原大语言模型转换成轻量化大语言模型;本发明克服了大语言模型参数量及存储空间占用大的问题,以及高倍压缩大语言模型时任务效果损失的问题。
技术关键词
大语言模型 矩阵 压缩系统 模块 蒸馏 因子 参数 分层 数据 线性 定义 基础
系统为您推荐了相关专利信息
1
作物生长仿真平台集成方法以及作物生长大模型构建方法
变量 模型构建方法 大语言模型 作物生长状态 仿真平台
2
一种基于神经辐射场的可解释可控三维重建方法和系统
三维重建方法 图像 三维重建系统 变量 解码器
3
测试电路集成方法、装置、电子设备及计算机存储介质
测试模块 测试电路 功能模块 对象 集成方法
4
一种智能低功耗Mini LED背光控制系统
背光控制系统 显示屏模块 光驱模块 低功耗 分区板
5
一种变频器柜的温湿度控制方法
温湿度控制方法 散热模组 露点温度 膨胀阀 电子除湿器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号