一种大模型压缩方法

AITNT
正文
推荐专利
一种大模型压缩方法
申请号:CN202411045364
申请日期:2024-08-01
公开号:CN119067181A
公开日期:2024-12-03
类型:发明专利
摘要
本发明公开了一种大模型压缩方法,对大模型的权重参数进行预处理,对激活值和预处理后的权重参数进行动态量化操作,得到量化后的激活值和权重参数,预设损失函数、训练样本以及样本标签,根据训练样本、量化后的激活值和权重参数前向计算训练样本的预测值,将训练样本的预测值与样本标签输入损失函数计算每次训练后的训练样本的总损失,并采用STE算法反向调整大模型的权重参数,预设损失阈值以及训练总次数,若当前次训练后训练样本的总损失达到损失阈值,或当前训练次数达到训练总次数,结束训练,得到压缩后的大模型。该方法通过剪枝结合动态量化技术,对大模型进行压缩,降低了大模型的计算量和存储空间,提高了大模型的推理速度和准确性。
技术关键词
模型压缩方法 参数 样本 标签 动态 算法 速度
系统为您推荐了相关专利信息
1
一种小卫星电源系统锂电池SOC在线估计方法
小卫星电源系统 在线估计方法 状态空间方程 锂电池 滑模观测器
2
一种智能指挥控制网络结构和关键节点预测方法
指挥控制网络 控制网络结构 门控循环单元 数据 节点
3
一种船舶航行里程数的计算方法、系统和可存储介质
船舶 轨迹 断点 数据 计算方法
4
高大模板支撑架施工期缺陷检测和安全评价方法
模板支撑架 强度 评价方法 聚类 模板连接件
5
一种固态硬盘的稳态性能调节方法和固态硬盘
固态硬盘 性能调节方法 因子 垃圾回收效率 执行垃圾回收
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号