摘要
本发明公开了一种大规模预训练模型快速压缩方法及系统。所述方法包括:获取训练后的大规模预训练模型的初始权重、预设稀疏度、预设精度、校准数据及标准数据;将剪枝后的大规模预训练模型按照骨架的级联结构拆分为多个串联的模块,并将每个模块拆分为多个基础单元;在大规模预训练模型的骨架中的第一个模块内,分别压缩每个所述基础单元;更新大规模预训练模型骨架中的第二个模块内权重;在所述骨架中的第二个模块内执行与相同的压缩操作,并在所述骨架中的第三个模块内执行相同的权重更新操作,直到在所述骨架中最后一个模块被执行完毕,获得压缩后的模型。本发明解决了在大规模预训练模型的压缩过程中消耗算力、存储及时间过高的问题。
技术关键词
预训练模型
压缩单元
校准
压缩系统
数据获取模块
精度
基础
级联
误差
标签
线性
样本
矩阵
场景
系统为您推荐了相关专利信息
智能生成方法
蒙特卡洛树搜索
搜索算法
计划
节点
高速流水线模数转换器
误差校准方法
非线性误差
时钟占空比
数据
拓扑图
物理
结构健康监测方法
多模态传感器
网络表征