摘要
本公开涉及人工智能技术领域,尤其涉及一种大语言模型压缩方法、装置、设备及存储介质。所述方法包括:对大语言模型的各个线性层的权重进行聚类,得到多个聚类中心;对于每个所述权重,计算所述权重与目标聚类中心之间的残差,并对所述残差进行分解,得到分解残差,其中所述目标聚类中心为距离所述权重最近的聚类中心;根据所述多个聚类中心和每个所述权重的分解残差,对所述大语言模型进行压缩。本公开实施例通过对各个线性层的权重采用聚类和残差处理,实现对大语言模型权重的高效压缩,同时尽可能保持模型的性能。
技术关键词
大语言模型
残差矩阵
非易失性计算机可读存储介质
K均值聚类算法
线性
人工智能技术
压缩装置
处理器
服务器
尺寸
模块
存储器
人类
终端
定义
关系
系统为您推荐了相关专利信息
网络安全风险
定量评估方法
信息物理系统
面向配电网
分类预测模型
角位移伺服系统
离心机模型箱
土工离心机
激光位移传感器
铰支座
混凝土减水剂
材料分析设备
非线性
参数
计算机辅助工程技术
线性恒流驱动电路
基准电压模块
场效应管
运算放大器输出
LED灯具