一种基于神经元归因和动态掩码的细粒度知识编辑方法

AITNT
正文
推荐专利
一种基于神经元归因和动态掩码的细粒度知识编辑方法
申请号:CN202511053282
申请日期:2025-07-30
公开号:CN120911568A
公开日期:2025-11-07
类型:发明专利
摘要
本发明提供一种基于神经元归因和动态掩码的细粒度知识编辑方法,包括:获取大语言模型和其需新学习的目标知识,为该目标知识编辑多个知识模板;基于多个知识模板,对大语言模型的多层前馈神经网络进行神经元级别的归因量化,得到各层前馈神经网络中每个神经元对各知识模板预测的重要性得分;根据各层前馈神经网络中各神经元对各知识模板预测的重要性得分,动态构建每层前馈神经网络的掩码向量,掩码向量指示前馈神经网络中需进行知识更新的神经元和无需进行知识更新的神经元;利用多个知识模板和掩码向量对大语言模型进行训练,训练时仅对大语言模型中的各层前馈神经网络中需要进行知识更新的神经元进行更新,有效提升模型终身知识编辑的精度。
技术关键词
大语言模型 知识编辑方法 模板 多层前馈神经网络 归因 知识问答方法 数值 动态 处理器 可读存储介质 文本 存储器 电子设备 答案 指令 计算机 因子
系统为您推荐了相关专利信息
1
金融风险信息的确定方法、系统以及计算机程序产品
风险评分模型 报告 数据 归因 计算机程序产品
2
故障定位方法、装置、电子设备及存储介质
故障报警信息 微服务系统 大语言模型 故障定位方法 故障传播路径
3
一种PDF扫描件识别方法、设备及介质
页面图片 识别PDF文件 多模型协同 识别方法 图片分类模型
4
一种利用大语言模型识别物料属性信息的方法与系统
大语言模型 分词算法 偏差 关键性 数据处理技术
5
一种基于代价敏感学习的冷热数据识别评价方法
代价敏感学习 识别评价方法 数据存储策略 资源分配 数据分类
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号