越狱提示词生成模型训练、越狱攻击方法及装置

正文

推荐专利

申请号：CN202510552503

申请日期：2025-04-28

公开号：CN120671802A

公开日期：2025-09-19

类型：发明专利

摘要

本说明书实施例公开了一种越狱提示词生成模型训练、越狱攻击方法及装置。该训练方法利用越狱攻击识别检测自动生成训练数据，减少对人工标注依赖，降低训练成本的同时提高了训练效率。此外，该训练方法通过模拟攻击‑检测‑反馈的闭环机制，结合自监督学习的策略在每次检测和反馈中进行自我优化，使得越狱提示词生成模型能够实时更新越狱策略，动态适应新型攻击。本说明书实施例所述的越狱提示词生成模型训练装置、越狱攻击方法以及越狱攻击装置同样具有上述有益效果。

技术关键词

图像样本主题图片模型训练装置文本生成模型训练方法模块生成训练数据电子设备可读存储介质元素存储器程序计算机策略标签处理器闭环机制

越狱提示词生成模型训练、越狱攻击方法及装置

站点导航

APP 下载