摘要
本发明实施例公开了一种模型编辑的方法和装置。本发明实施例中,通过确定三组待编辑查询语句,在知识数据库中检索到其对应的至少一条知识数据;确定每组待编辑查询语句以及至少一条知识数据的增强表征;根据增强表征确定对应的提示字符表征;确定每一个待编辑查询语句对应的输入嵌入表征;根据提示字符表征和输入嵌入表征的组合,对大规模语言模型进行编辑,生成更新后的大规模语言模型,并生成至少一个语义向量;根据三组待编辑查询语句分别对应的语义向量以及增强表征确定损失函数;根据损失函数对所述更新后的大规模语言模型进行编辑生成目标大规模语言模型。通过上述方法,可以实现终身模型编辑,并降低LLMs在编辑过程中产生的能力退化问题。
技术关键词
编辑
语句
语义向量
多层感知器
字符
计算机程序指令
数据
可读存储介质
索引
处理器
存储器
电子设备
图谱
系统为您推荐了相关专利信息
自动修复方法
兼容性问题
参数
关键字
抽象语法树
农村污水处理系统
神经网络控制器
平衡控制器
集成控制系统
生物需氧量
查询语句生成方法
自然语言
查询数据表
对象
字段
压缩器
数据压缩方法
字符
先进先出方式
查询哈希表