可变内存环境下细粒度尺寸控制的大型语言模型压缩方法

正文

推荐专利

申请号：CN202510043329

申请日期：2025-01-10

公开号：CN120012842A

公开日期：2025-05-16

类型：发明专利

摘要

本发明提供一种可变内存环境下细料度尺寸控制的大型语言模型压缩方法，包括计算激活值感知的权重矩阵的步骤、对其激活值感知的权重矩阵的绝对值矩阵进行迭代分解的步骤、对迭代分解出的多个残差数据块进行重要性评估和排序的步骤、以及根据可用内容容量的变化以及重要性排序动态加载残差数据块以构成不同压缩模型的步骤。通过这样的方法，能够使得压缩模型很好地适应可变内存环境，从而能够在本地设备中部署模型，并且由于优先加载重要性更高的残差数据块，因此压缩模型仍具有与原大型语言模型接近的优秀性能，即使是在极端压缩比的情况下也是如此，因此压缩模型也无需再经过训练，使得模型在本地设备中的部署更为方便和高效。

技术关键词

语言模型压缩方法残差数据矩阵内存符号尺寸因子校准动态参数

系统为您推荐了相关专利信息

一种基于动态场景的病虫害检测方法及系统

病虫害检测方法动态场景多尺度特征金字塔识别病虫害交互模型

平方根晶格平滑变结构Tobit滤波的无人机状态估计方法

无人机状态估计平方根预测误差估计误差合作无人机

一种踩内存定位方法及相关装置

内存定位方法接口单元列表对象

一种基于大数据的线路板生产质量预测评估方法

预测评估方法更换钻头孔壁光洁度线路板加工过程大数据

任务运行时的动态存储管理方法、装置、设备及介质

动态存储管理方法频率内存对象后端系统

可变内存环境下细粒度尺寸控制的大型语言模型压缩方法

站点导航

APP 下载