一种大模型压缩方法

正文

推荐专利

一种大模型压缩方法

申请号：CN202411045364

申请日期：2024-08-01

公开号：CN119067181A

公开日期：2024-12-03

类型：发明专利

摘要

本发明公开了一种大模型压缩方法，对大模型的权重参数进行预处理，对激活值和预处理后的权重参数进行动态量化操作，得到量化后的激活值和权重参数，预设损失函数、训练样本以及样本标签，根据训练样本、量化后的激活值和权重参数前向计算训练样本的预测值，将训练样本的预测值与样本标签输入损失函数计算每次训练后的训练样本的总损失，并采用STE算法反向调整大模型的权重参数，预设损失阈值以及训练总次数，若当前次训练后训练样本的总损失达到损失阈值，或当前训练次数达到训练总次数，结束训练，得到压缩后的大模型。该方法通过剪枝结合动态量化技术，对大模型进行压缩，降低了大模型的计算量和存储空间，提高了大模型的推理速度和准确性。

技术关键词

模型压缩方法参数样本标签动态算法速度

系统为您推荐了相关专利信息

一种小卫星电源系统锂电池SOC在线估计方法

小卫星电源系统在线估计方法状态空间方程锂电池滑模观测器

一种智能指挥控制网络结构和关键节点预测方法

指挥控制网络控制网络结构门控循环单元数据节点

一种船舶航行里程数的计算方法、系统和可存储介质

船舶轨迹断点数据计算方法

高大模板支撑架施工期缺陷检测和安全评价方法

模板支撑架强度评价方法聚类模板连接件

一种固态硬盘的稳态性能调节方法和固态硬盘

固态硬盘性能调节方法因子垃圾回收效率执行垃圾回收

一种大模型压缩方法

站点导航

APP 下载