基于生成式协同学习的无监督黑盒成员推理攻击方法及系统

正文

推荐专利

申请号：CN202510399011

申请日期：2025-04-01

公开号：CN120278201B

公开日期：2025-12-02

类型：发明专利

摘要

本发明提供一种基于生成式协同学习的无监督黑盒成员推理攻击方法及系统，引入生成器、判别器和协同框架。将样本输入多项启发式任务，计算各启发式任务的任务分数；利用生成器聚合所有任务分数，生成样本的伪标签，并基于动态阈值过滤噪声样本；计算样本输入提示和大语言模型输出响应间的偏移向量，以表示大语言模型内部状态；将偏移向量作为判别器输入，借助生成器生成的伪标签，对判别器进行训练，使得判别器能够根据偏移向量预测样本的成员概率。将判别器生成的成员概率作为样本的新的伪标签，帮助生成器进行训练优化。迭代交叉监督训练，直至判别器收敛。基于本发明方法训练得到的判别器能够在完全黑盒和无监督条件下实现高性能的成员推理。

技术关键词

置信度阈值累积分布函数标签大语言模型编码器噪声样本训练集动态高性能定义框架

系统为您推荐了相关专利信息

车辆损伤检测方法、装置、设备及存储介质

车辆损伤检测方法样本教师信息熵网络

一种基于二维不可分小波变换的端到端图像无损压缩方法

图像无损压缩方法预测滤波器算术编码器编码模块卷积神经网络结构

一种基于自适应局部知识填充的遥感图文检索方法

图文检索方法文本图像特征提取特征提取器融合全局

一种涉及隐私保护的模型训练、微调和推理系统及方法

加解密模块大语言模型加密数据推理系统云端服务器

复杂指令遵循能力评测方法和装置、计算设备、存储介质

评分方法能力评测方法大语言模型关系指令

基于生成式协同学习的无监督黑盒成员推理攻击方法及系统

站点导航

APP 下载