一种序列化模型编辑的方法和装置

正文

推荐专利

一种序列化模型编辑的方法和装置

申请号：CN202411055522

申请日期：2024-08-01

公开号：CN118917399A

公开日期：2024-11-08

类型：发明专利

摘要

本发明实施例公开了一种序列化模型编辑的方法和装置。本发明实施例中，通过获取待编辑知识三元组数据，定位到大规模语言模型的多层感知器层，确定第一参数和待编辑的第二参数；根据待编辑知识三元组数据、第一参数和待编辑的第二参数，确定结构编辑损失函数；根据结构编辑损失函数更新待编辑的第二参数；将更新后的待编辑的第二参数保存到知识参数队列；根据更新后的所述待编辑的第二参数对知识参数队列中的多个已编辑的第二参数进行更新；将更新后的待编辑的第二参数和更新后的所述多个已编辑的第二参数对所述大规模语言模型的多层感知器层进行更新。通过上述方法，可以降低大规模语言模型在序列化编辑过程中产生的能力退化问题。

技术关键词

编辑三元组参数多层感知器队列数据计算机程序指令实体数值可读存储介质序列语义定位单元处理器关系存储器样本电子设备

系统为您推荐了相关专利信息

基于混合网络协同覆盖场景下的接入选择方法及相关设备

混合网络训练样本数据神经网络模型训练场景无人机协同工作

基于NASH均衡博弈理论的太赫兹超材料多目标优化方法

太赫兹超材料超材料传感器传感器结构策略更新多性能参数

查尔酮类化合物在制备治疗肺动脉高压的药物中的应用

肺动脉高压患者血流动力学参数查尔酮类化合物慢性血栓栓塞性肺动脉高压预防肺动脉高压

账户恢复方法、装置、设备及存储介质

账户数字签名验证哈希算法区块链节点设备数据

基于时空信息数据的水利水电基坑开挖工程管理系统及方法

倾斜摄影数据基坑开挖工程三维模型管理系统数据存储模块

一种序列化模型编辑的方法和装置

站点导航

APP 下载