一种自回归大语言模型的知识编辑方法和装置

正文

推荐专利

申请号：CN202510337893

申请日期：2025-03-21

公开号：CN120218023B

公开日期：2025-11-18

类型：发明专利

摘要

本发明实施例涉及一种自回归大语言模型的知识编辑方法和装置，所述方法包括：将自回归大语言模型作为目标模型；并对目标模型的预训练知识库中的各个知识条目进行问题‑答案文本对转换；对各文本对按三类模型推理方式(单次正常推理、单次加扰推理、加扰前提下的多次修复推理)进行处理得到第一、第二预测文本和第三预测信息集；并基于各文本对的第一、第二预测文本和第三预测信息集进行一次关键层预估；并根据所有预估关键层进行关键层终判，并通过在所有关键层植入低秩矩阵参数的方式对目标模型进行参数重置；并由植入的所有低秩矩阵参数组成植入参数集，并在每次知识编辑过程中只对植入参数集进行更新。本发明可以提高编辑效率、降低编辑成本。

技术关键词

知识编辑方法大语言模型标签文本板块矩阵参数分词答案指令条目模板索引优化器计数器收发器序列计算机模块

系统为您推荐了相关专利信息

一种基于时空配准的传递对准方法及系统、电子设备

导弹传递对准方法三维模型矩阵标记

波束跟踪方法、装置、设备、存储介质及程序产品

波束赋形设计波束跟踪方法对象协方差矩阵扩展卡尔曼滤波

风荷载作用下钢结构构件滞回参数模型的构建方法及装置

钢结构构件风荷载参数曲线 UKF算法

多层电路板及其制作工艺

电路板外观多层电路板语义多尺度像素

一种孤岛检测方法、装置、设备及存储介质

GCN模型特征提取模型孤岛检测方法检测数据输入空间特征提取

一种自回归大语言模型的知识编辑方法和装置

站点导航

APP 下载