一种大语言模型的知识编辑方法、装置和电子设备

AITNT
正文
推荐专利
一种大语言模型的知识编辑方法、装置和电子设备
申请号:CN202411649720
申请日期:2024-11-19
公开号:CN119167895B
公开日期:2025-03-11
类型:发明专利
摘要
发明公开了一种大语言模型的知识编辑方法、装置和电子设备,涉及计算模型和人工智能技术领域。方法包括:利用随机前缀和第一隐藏状态计算大语言模型各编辑层的编辑历史的主体向量;利用第二隐藏状态计算大语言模型各编辑层的编辑历史的关系向量;利用编辑历史的主体向量、编辑历史的关系向量和整个模型层的协方差矩阵计算编辑层的输出权重的偏移量;利用偏移量更新编辑层的输出权重;利用更新的编辑层的输出权重对大语言模型的编辑层进行知识编辑。本方法只需要存储空间,并允许将序列编辑方法转换为批处理编辑方法,从而减少序列编辑过程中对编辑模型的损坏,实现了轻损害知识编辑。该方法突破了现有技术中的编辑瓶颈问题,具有优越的性能。
技术关键词
知识编辑方法 大语言模型 协方差矩阵 字符 关系 噪声 标记 非线性 电子设备 样本 编辑装置 人工智能技术 主题 处理器 注意力机制 序列 存储器 指令
系统为您推荐了相关专利信息
1
基于机器学习辅助开发MOFs改性聚氨酯材料的方法
改性聚氨酯材料 机器学习辅助 机器学习模型 朴素贝叶斯模型 发泡材料技术
2
一种风控的AUC优化自适应增强树模型建立方法
模型建立方法 训练注意力 样本 多头注意力机制 注意力模型
3
汽车通信网络的攻击类型检测方法、系统、设备及介质
汽车通信网络 字段 数据 序列 神经网络模型
4
负载预测方法及装置、设备、存储介质
算法模块 负载预测方法 电子设备 复杂度 数据
5
汽车碰撞安全优化方法、装置、电子设备和存储介质
受力 运动 汽车 关系 安全带
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号