一种基于知识注入攻击的大语言模型法律领域鲁棒性评估方法

正文

推荐专利

申请号：CN202411636101

申请日期：2024-11-15

公开号：CN119494405B

公开日期：2025-11-25

类型：发明专利

摘要

本申请提出一种基于知识注入攻击的大语言模型法律领域鲁棒性评估方法，其中，方法包括：通过检索增强生成攻击和相似罪名攻击，对法律领域的大语言模型基于输入的法律条文所做的大前提判断进行干扰；通过词汇攻击、要件攻击和叙述攻击，对大语言模型基于输入的案件事实的叙述准确性进行干扰；通过先前行为攻击和专家意见攻击，对大语言模型的最终结论判断进行干扰，以评估其在法律推理中的抗干扰能力。本申请提出了以亚里士多德三段论为基础的逻辑攻击框架，对问题的语义逻辑、专业逻辑推理进行攻击，更广泛的涵盖了现实生活中经常出现的错误类型，能够真实评价领域大模型的鲁棒性。

技术关键词

大语言模型案件鲁棒性评估方法计算机执行指令同义词逻辑可读存储介质计算机程序产品处理器通信现实生活存储器语句观点身份阶段电子设备

一种基于知识注入攻击的大语言模型法律领域鲁棒性评估方法

站点导航

APP 下载