一种基于知识注入攻击的大语言模型法律领域鲁棒性评估方法

AITNT
正文
推荐专利
一种基于知识注入攻击的大语言模型法律领域鲁棒性评估方法
申请号:CN202411636101
申请日期:2024-11-15
公开号:CN119494405B
公开日期:2025-11-25
类型:发明专利
摘要
本申请提出一种基于知识注入攻击的大语言模型法律领域鲁棒性评估方法,其中,方法包括:通过检索增强生成攻击和相似罪名攻击,对法律领域的大语言模型基于输入的法律条文所做的大前提判断进行干扰;通过词汇攻击、要件攻击和叙述攻击,对大语言模型基于输入的案件事实的叙述准确性进行干扰;通过先前行为攻击和专家意见攻击,对大语言模型的最终结论判断进行干扰,以评估其在法律推理中的抗干扰能力。本申请提出了以亚里士多德三段论为基础的逻辑攻击框架,对问题的语义逻辑、专业逻辑推理进行攻击,更广泛的涵盖了现实生活中经常出现的错误类型,能够真实评价领域大模型的鲁棒性。
技术关键词
大语言模型 案件 鲁棒性评估方法 计算机执行指令 同义词 逻辑 可读存储介质 计算机程序产品 处理器通信 现实生活 存储器 语句 观点 身份 阶段 电子设备
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号