一种基于神经元归因和动态掩码的细粒度知识编辑方法

正文

推荐专利

申请号：CN202511053282

申请日期：2025-07-30

公开号：CN120911568A

公开日期：2025-11-07

类型：发明专利

摘要

本发明提供一种基于神经元归因和动态掩码的细粒度知识编辑方法，包括：获取大语言模型和其需新学习的目标知识，为该目标知识编辑多个知识模板；基于多个知识模板，对大语言模型的多层前馈神经网络进行神经元级别的归因量化，得到各层前馈神经网络中每个神经元对各知识模板预测的重要性得分；根据各层前馈神经网络中各神经元对各知识模板预测的重要性得分，动态构建每层前馈神经网络的掩码向量，掩码向量指示前馈神经网络中需进行知识更新的神经元和无需进行知识更新的神经元；利用多个知识模板和掩码向量对大语言模型进行训练，训练时仅对大语言模型中的各层前馈神经网络中需要进行知识更新的神经元进行更新，有效提升模型终身知识编辑的精度。

技术关键词

大语言模型知识编辑方法模板多层前馈神经网络归因知识问答方法数值动态处理器可读存储介质文本存储器电子设备答案指令计算机因子

系统为您推荐了相关专利信息

金融风险信息的确定方法、系统以及计算机程序产品

风险评分模型报告数据归因计算机程序产品

故障定位方法、装置、电子设备及存储介质

故障报警信息微服务系统大语言模型故障定位方法故障传播路径

一种PDF扫描件识别方法、设备及介质

页面图片识别PDF文件多模型协同识别方法图片分类模型

一种利用大语言模型识别物料属性信息的方法与系统

大语言模型分词算法偏差关键性数据处理技术

一种基于代价敏感学习的冷热数据识别评价方法

代价敏感学习识别评价方法数据存储策略资源分配数据分类

一种基于神经元归因和动态掩码的细粒度知识编辑方法

站点导航

APP 下载