一阶误差补偿量化的大模型低资源开销文本理解生成方法

正文

推荐专利

申请号：CN202510966948

申请日期：2025-07-14

公开号：CN120804291A

公开日期：2025-10-17

类型：发明专利

摘要

本发明涉及文本生成技术领域，公开了一种一阶误差补偿量化的大模型低资源开销文本理解生成方法，包括获取执行标准自回归文本生成任务的预训练大语言文本生成模型，并构建校准文本数据集；以校准文本数据集作为模型输入，对预训练大语言文本生成模型执行标准自回归文本生成任务时神经网络层的权重按照列量化顺序进行一阶误差补偿量化；采用量化后的大语言文本生成模型进行标准自回归文本生成。本发明能够提升大语言文本生成模型执行标准自回归文本生成任务时计算资源消耗，并且显著提高推理准确性和稳定性。

技术关键词

文本生成模型文本理解生成方法误差矩阵资源文本生成技术校准拉格朗日阶梯元素数据精度符号因子

一阶误差补偿量化的大模型低资源开销文本理解生成方法

站点导航

APP 下载