摘要
本申请公开了一种针对推荐系统的模型窃取攻击方法及其系统,方法包括:通过大语言模型LLM排序器模拟真实用户行为,生成符合用户行为模式的合成数据;其中,LLM排序器包括:记忆压缩MC模块及偏好稳定PS模块,记忆压缩MC模块选择性保留所述LLM中存储的有效历史交互;偏好稳定PS模块从所述LLM中存储的历史交互中提取用户偏好的概要;基于合成数据,训练替代模型,采用知识蒸馏方法实现模型窃取。本发明方法能够生成更具代表性且覆盖面更广的合成数据,使得攻击者能够更高效地窃取目标模型,同时生成的数据也更能反映真实用户的偏好和行为模式,从而提升攻击的效果和精度。
技术关键词
推荐系统
知识蒸馏方法
大语言模型
模块
记忆
历史交互信息
列表
内存
数据
模式
采样器
交互历史
处理器
生成用户
摘要
序列
可读存储介质
覆盖率
存储器
策略
系统为您推荐了相关专利信息
医学图像分割模型
注意力
医学图像分割方法
输出特征
解码模块
深度强化学习模型
优化设计方法
电解槽
遗传算法
优化流道设计