摘要
本发明提供一种可变内存环境下细料度尺寸控制的大型语言模型压缩方法,包括计算激活值感知的权重矩阵的步骤、对其激活值感知的权重矩阵的绝对值矩阵进行迭代分解的步骤、对迭代分解出的多个残差数据块进行重要性评估和排序的步骤、以及根据可用内容容量的变化以及重要性排序动态加载残差数据块以构成不同压缩模型的步骤。通过这样的方法,能够使得压缩模型很好地适应可变内存环境,从而能够在本地设备中部署模型,并且由于优先加载重要性更高的残差数据块,因此压缩模型仍具有与原大型语言模型接近的优秀性能,即使是在极端压缩比的情况下也是如此,因此压缩模型也无需再经过训练,使得模型在本地设备中的部署更为方便和高效。
技术关键词
语言模型压缩方法
残差数据
矩阵
内存
符号
尺寸
因子
校准
动态
参数
系统为您推荐了相关专利信息
病虫害检测方法
动态场景
多尺度特征金字塔
识别病虫害
交互模型
无人机状态估计
平方根
预测误差
估计误差
合作无人机
预测评估方法
更换钻头
孔壁光洁度
线路板加工过程
大数据