一种大规模预训练模型快速压缩方法及系统

AITNT
正文
推荐专利
一种大规模预训练模型快速压缩方法及系统
申请号:CN202510327982
申请日期:2025-03-19
公开号:CN120218140A
公开日期:2025-06-27
类型:发明专利
摘要
本发明公开了一种大规模预训练模型快速压缩方法及系统。所述方法包括:获取训练后的大规模预训练模型的初始权重、预设稀疏度、预设精度、校准数据及标准数据;将剪枝后的大规模预训练模型按照骨架的级联结构拆分为多个串联的模块,并将每个模块拆分为多个基础单元;在大规模预训练模型的骨架中的第一个模块内,分别压缩每个所述基础单元;更新大规模预训练模型骨架中的第二个模块内权重;在所述骨架中的第二个模块内执行与相同的压缩操作,并在所述骨架中的第三个模块内执行相同的权重更新操作,直到在所述骨架中最后一个模块被执行完毕,获得压缩后的模型。本发明解决了在大规模预训练模型的压缩过程中消耗算力、存储及时间过高的问题。
技术关键词
预训练模型 压缩单元 校准 压缩系统 数据获取模块 精度 基础 级联 误差 标签 线性 样本 矩阵 场景
系统为您推荐了相关专利信息
1
融合故障预测的IT设备维修任务动态调度方法
动态调度方法 IT设备 矩阵 历史故障数据 频率
2
基于蒙特卡洛树搜索算法的施工进度计划智能生成方法
智能生成方法 蒙特卡洛树搜索 搜索算法 计划 节点
3
一种城市内涝水深预测方法、装置及存储介质
水深预测方法 栅格 模拟模型 排水口 径流
4
基于神经网络的高速高精度模数转换器全域误差校准方法
高速流水线模数转换器 误差校准方法 非线性误差 时钟占空比 数据
5
建筑动态结构健康监测方法
拓扑图 物理 结构健康监测方法 多模态传感器 网络表征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号