一种大语言模型的知识编辑方法、装置和电子设备

正文

推荐专利

申请号：CN202411649720

申请日期：2024-11-19

公开号：CN119167895B

公开日期：2025-03-11

类型：发明专利

摘要

发明公开了一种大语言模型的知识编辑方法、装置和电子设备，涉及计算模型和人工智能技术领域。方法包括：利用随机前缀和第一隐藏状态计算大语言模型各编辑层的编辑历史的主体向量；利用第二隐藏状态计算大语言模型各编辑层的编辑历史的关系向量；利用编辑历史的主体向量、编辑历史的关系向量和整个模型层的协方差矩阵计算编辑层的输出权重的偏移量；利用偏移量更新编辑层的输出权重；利用更新的编辑层的输出权重对大语言模型的编辑层进行知识编辑。本方法只需要存储空间，并允许将序列编辑方法转换为批处理编辑方法，从而减少序列编辑过程中对编辑模型的损坏，实现了轻损害知识编辑。该方法突破了现有技术中的编辑瓶颈问题，具有优越的性能。

技术关键词

知识编辑方法大语言模型协方差矩阵字符关系噪声标记非线性电子设备样本编辑装置人工智能技术主题处理器注意力机制序列存储器指令

系统为您推荐了相关专利信息

基于机器学习辅助开发MOFs改性聚氨酯材料的方法

改性聚氨酯材料机器学习辅助机器学习模型朴素贝叶斯模型发泡材料技术

一种风控的AUC优化自适应增强树模型建立方法

模型建立方法训练注意力样本多头注意力机制注意力模型

汽车通信网络的攻击类型检测方法、系统、设备及介质

汽车通信网络字段数据序列神经网络模型

负载预测方法及装置、设备、存储介质

算法模块负载预测方法电子设备复杂度数据

汽车碰撞安全优化方法、装置、电子设备和存储介质

受力运动汽车关系安全带

一种大语言模型的知识编辑方法、装置和电子设备

站点导航

APP 下载