基于工作记忆树的大语言模型漏洞测试方法

正文

推荐专利

基于工作记忆树的大语言模型漏洞测试方法

申请号：CN202511156094

申请日期：2025-08-18

公开号：CN120910871A

公开日期：2025-11-07

类型：发明专利

摘要

本发明公开了一种基于工作记忆树的大语言模型漏洞测试方法，所述方法包括以下步骤：步骤1：恶意语义文本采集；步骤2：自动对抗提示构建；步骤3：大语言模型漏洞测试；步骤4：测试结果评估；步骤5：对抗提示迭代优化。本发明能够精准构建具备隐蔽性和攻击多样性的对抗性提示，改善传统大语言模型漏洞测试方法在覆盖范围有限和多提示探索性不足的局限性。

技术关键词

漏洞测试方法大语言模型对抗性令牌注意力指数衰减函数自然语言理解危害性语义层面文本关键字节点爬虫技术处理器序列多路径存储器多角度

基于工作记忆树的大语言模型漏洞测试方法

站点导航

APP 下载