一种面向偏见内容的大语言模型知识编辑方法

正文

推荐专利

申请号：CN202510591569

申请日期：2025-05-08

公开号：CN120509439A

公开日期：2025-08-19

类型：发明专利

摘要

本发明公开了一种面向偏见内容的大语言模型知识编辑方法，包括以下步骤：获取待修正偏见类型的测试文本集，所述测试文本集中包括包括具有待修正偏见类型的有偏见文本和对应的无偏见文本；依次将所述无偏见文本和有偏见文本输入待修正的大语言模型中，同时依次获得所述大语言模型各偏见层的参数，所述偏见层的参数包括前馈神经网络FFN中各层的输出和多头自注意力MHSA的权重；根据各偏见层的参数计算得到各偏见层在无偏见文本时相对于有偏见文本时的偏离程度；根据所述偏离程度确定出至少一个与该待修正偏见类型对应的目标层；对大语言模型参数进行调整。其通过通过动态分析偏见传播路径，结合激活差异和梯度反向传播，精准识别目标层，提高对偏见修正的准确性。

技术关键词

知识编辑方法文本大语言模型前馈神经网络参数指数衰减函数矩阵注意力钩子

系统为您推荐了相关专利信息

一种基于主动视觉的领航-跟随法无人艇编队控制方法

无人艇编队云台相机转向控制器坐标误差运动控制器

基于电子病历信息的术前麻醉风险评估方法及系统

电子病历数据电子病历信息风险评估方法 GBDT算法因子

一种Wi-Fi模组的参数调整方法及系统

抗干扰特征优化业务注意力模型模组射频

一种模型训练方法及程序产品

人工智能模型微纳结构拟合算法参数模型训练方法

一种嵌入式计算机数字孪生体多类模型的联合仿真方法

联合仿真方法嵌入式计算机数字孪生仿真模型资源特征

一种面向偏见内容的大语言模型知识编辑方法

站点导航

APP 下载