大语言模型二值化压缩方法及系统

正文

推荐专利

大语言模型二值化压缩方法及系统

申请号：CN202510965081

申请日期：2025-07-14

公开号：CN120893497A

公开日期：2025-11-04

类型：发明专利

摘要

本发明提供了一种大语言模型二值化压缩方法及系统。其中方法包括：对大语言模型进行后训练二值化压缩处理，得到1‑bit结构化权重初始模型；对结构化权重初始模型的每一层的权重矩阵进行Hadamard归一化预处理；基于归一化处理后的模型构造量化感知训练初始点；基于初始点，采用逐层冻结‑解冻策略，对归一化处理后的模型逐层进行量化感知训练，输出最终稳定训练后的1‑bit模型，完成大语言模型的可训练二值化压缩处理。本发明可应用于医疗语义标注任务、不具备训练语料的嵌入式部署任务以及手机端NLP推理加速任务等任务中，显著提升低比特模型的可训练性与收敛速度，形成了训练效率高、模型精度高的一体化压缩方法。

技术关键词

大语言模型 Hadamard变换插值模块矩阵量化误差语义标注方法医疗文本数据策略校准动态医疗场景线性压缩系统因子分布特征中间层

大语言模型二值化压缩方法及系统

站点导航

APP 下载