摘要
本发明提供一种基于知识编辑的大模型自适应祛毒方法及装置,涉及自然语言处理技术领域。该方法包括:构建基于知识编辑的大模型自适应祛毒模型;将构建好的训练集输入大语言模型中,获得特征向量;根据特征向量,构建训练样本数据;根据训练样本数据对毒性检测模块进行训练,获得训练好的毒性检测模块;将训练好的毒性检测模块插入大语言模型的目标层中,通过毒性特征感知模块进行感知,获得分类结果;将分类结果输入抗毒性前馈计算模块中,通过参数隔离编辑策略,确定待祛毒的参数矩阵;采用梯度优化方法和知识编辑方法进行优化,获得祛毒后的前馈网络;根据祛毒后的前馈网络,获得祛毒后的大语言模型。采用本发明可减少计算成本。
技术关键词
大语言模型
知识编辑方法
训练样本数据
模块
计算机可读取存储介质
参数
矩阵
语义特征
网络
计算机可读指令
训练集
动态
注意力
信号
策略
自然语言
处理器
分类器
存储器