可变内存环境下细粒度尺寸控制的大型语言模型压缩方法

AITNT
正文
推荐专利
可变内存环境下细粒度尺寸控制的大型语言模型压缩方法
申请号:CN202510043329
申请日期:2025-01-10
公开号:CN120012842A
公开日期:2025-05-16
类型:发明专利
摘要
本发明提供一种可变内存环境下细料度尺寸控制的大型语言模型压缩方法,包括计算激活值感知的权重矩阵的步骤、对其激活值感知的权重矩阵的绝对值矩阵进行迭代分解的步骤、对迭代分解出的多个残差数据块进行重要性评估和排序的步骤、以及根据可用内容容量的变化以及重要性排序动态加载残差数据块以构成不同压缩模型的步骤。通过这样的方法,能够使得压缩模型很好地适应可变内存环境,从而能够在本地设备中部署模型,并且由于优先加载重要性更高的残差数据块,因此压缩模型仍具有与原大型语言模型接近的优秀性能,即使是在极端压缩比的情况下也是如此,因此压缩模型也无需再经过训练,使得模型在本地设备中的部署更为方便和高效。
技术关键词
语言模型压缩方法 残差数据 矩阵 内存 符号 尺寸 因子 校准 动态 参数
系统为您推荐了相关专利信息
1
一种基于动态场景的病虫害检测方法及系统
病虫害检测方法 动态场景 多尺度特征金字塔 识别病虫害 交互模型
2
平方根晶格平滑变结构Tobit滤波的无人机状态估计方法
无人机状态估计 平方根 预测误差 估计误差 合作无人机
3
一种踩内存定位方法及相关装置
内存 定位方法 接口单元 列表 对象
4
一种基于大数据的线路板生产质量预测评估方法
预测评估方法 更换钻头 孔壁光洁度 线路板加工过程 大数据
5
任务运行时的动态存储管理方法、装置、设备及介质
动态存储管理方法 频率 内存 对象 后端系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号