大语言模型压缩方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202510612690

申请日期：2025-05-13

公开号：CN120123803B

公开日期：2025-09-23

类型：发明专利

摘要

本公开涉及人工智能技术领域，尤其涉及一种大语言模型压缩方法、装置、设备及存储介质。所述方法包括：对大语言模型的各个线性层的权重进行聚类，得到多个聚类中心；对于每个所述权重，计算所述权重与目标聚类中心之间的残差，并对所述残差进行分解，得到分解残差，其中所述目标聚类中心为距离所述权重最近的聚类中心；根据所述多个聚类中心和每个所述权重的分解残差，对所述大语言模型进行压缩。本公开实施例通过对各个线性层的权重采用聚类和残差处理，实现对大语言模型权重的高效压缩，同时尽可能保持模型的性能。

技术关键词

大语言模型残差矩阵非易失性计算机可读存储介质 K均值聚类算法线性人工智能技术压缩装置处理器服务器尺寸模块存储器人类终端定义关系

系统为您推荐了相关专利信息

面向配电网信息物理系统的网络安全风险定量评估方法

网络安全风险定量评估方法信息物理系统面向配电网分类预测模型

一种用于鼓式土工离心机内的六自由度加载装置

角位移伺服系统离心机模型箱土工离心机激光位移传感器铰支座

混凝土减水剂配方优化方法

混凝土减水剂材料分析设备非线性参数计算机辅助工程技术

一种基于大模型的精准搜索方法、装置及设备

搜索方法实体画像条目大语言模型

LED灯具及其线性恒流驱动电路、LED灯具的驱动方法

线性恒流驱动电路基准电压模块场效应管运算放大器输出 LED灯具

大语言模型压缩方法、装置、设备及存储介质

站点导航

APP 下载