摘要
本发明实施例公开了一种序列化模型编辑的方法和装置。本发明实施例中,通过获取待编辑知识三元组数据,定位到大规模语言模型的多层感知器层,确定第一参数和待编辑的第二参数;根据待编辑知识三元组数据、第一参数和待编辑的第二参数,确定结构编辑损失函数;根据结构编辑损失函数更新待编辑的第二参数;将更新后的待编辑的第二参数保存到知识参数队列;根据更新后的所述待编辑的第二参数对知识参数队列中的多个已编辑的第二参数进行更新;将更新后的待编辑的第二参数和更新后的所述多个已编辑的第二参数对所述大规模语言模型的多层感知器层进行更新。通过上述方法,可以降低大规模语言模型在序列化编辑过程中产生的能力退化问题。
技术关键词
编辑
三元组
参数
多层感知器
队列
数据
计算机程序指令
实体
数值
可读存储介质
序列
语义
定位单元
处理器
关系
存储器
样本
电子设备
系统为您推荐了相关专利信息
混合网络
训练样本数据
神经网络模型训练
场景
无人机协同工作
太赫兹超材料
超材料传感器
传感器结构
策略更新
多性能参数
肺动脉高压患者
血流动力学参数
查尔酮类化合物
慢性血栓栓塞性肺动脉高压
预防肺动脉高压
账户
数字签名验证
哈希算法
区块链节点设备
数据
倾斜摄影数据
基坑开挖工程
三维模型
管理系统
数据存储模块