一种基于知识遗忘的大模型对齐方法及装置

正文

推荐专利

一种基于知识遗忘的大模型对齐方法及装置

申请号：CN202510367596

申请日期：2025-03-26

公开号：CN120373355A

公开日期：2025-07-25

类型：发明专利

摘要

本发明提供一种基于知识遗忘的大模型对齐方法及装置，涉及自然语言处理技术领域。该方法包括：获取大语言模型内部的各个参数权重，对每个神经元计算重要性评分，对神经元进行排序，构建二值化知识遗忘掩码；根据排序结果确定知识遗忘层和遗忘模块；获取有害指令及有害响应，构建有害知识数据集；设定优化目标，根据二值化知识遗忘掩码、有害知识数据集、优化目标以及受限梯度上升算法对知识遗忘层和遗忘模块进行有害知识遗忘训练，得到训练好的大语言模型。本发明提出的CKU方法通过采用约束优化技术，将安全对齐任务转化为受限知识遗忘任务，精确地去除生成式大语言模型中不必要或有害的知识，同时确保模型的整体性能和效能得以保持。

技术关键词

对齐方法计算机可读取存储介质大语言模型对齐装置计算机可读指令对齐设备约束优化技术数据受限样本算法参数自然语言处理器标记输出模块存储器效能

系统为您推荐了相关专利信息

基于多模态大模型的输电线路的山火隐患识别方法及装置

融合图像特征文本语义向量图像特征提取加权特征

一种基于文档嵌入的查询匹配方法及装置

文本查询匹配方法计算机存储介质阶段离线

一种编程语言转换方法、装置、设备及存储介质

大语言模型节点转换方法抽象语法树代码转换

一种多模态特征的生成方法、装置、电子设备及存储介质

多模态特征大语言模型音频编码文本交叉注意力机制

一种基于大模型的申论考试自动批改方法

自动批改方法关键词节点答案微调方法

一种基于知识遗忘的大模型对齐方法及装置

站点导航

APP 下载