一种面向生成式大语言模型拆分学习的数据重构攻击防御方法

正文

推荐专利

申请号：CN202510489049

申请日期：2025-04-18

公开号：CN120562515A

公开日期：2025-08-29

类型：发明专利

摘要

本发明公开了一种面向生成式大语言模型拆分学习的数据重构攻击防御方法，方法包括：获取待进行数据重构攻击防御的大语言模型拆分学习系统和训练数据集；该系统包括部署于客户端的底部模型和顶部模型，以及部署于服务端的主干模型；构建敏感特征解耦模块并在前向传播阶段基于训练数据集对其进行更新，敏感特征解耦模块接收底部模型输出的中间表征，输出安全激活值至主干模型；在反向传播阶段，基于顶部模型的输出并利用交叉熵损失对顶部模型进行优化更新，以及采用协方差矩阵自适应进化策略对底部模型执行无梯度优化，获得训练好的大语言模型拆分学习系统。本发明降低了当前大语言模型拆分学习系统潜在遭受的数据重构攻击威胁。

技术关键词

攻击防御方法大语言模型学习系统重构进化策略数据多层感知机连续型协方差矩阵非线性客户端模块自动编码器拆分方法服务端参数阶段标签

系统为您推荐了相关专利信息

一种基于业务语境增强的可观测性系统

数据采集层数据采集策略数据存储模块大数据处理框架日志

一种生成CTO-PCI手术评估报告的方法和系统

冠状动脉血管造影手术 CT扫描系统报告大语言模型

交互叙事型教育游戏智能生成方法、系统、设备、介质及程序产品

教育游戏智能生成方法图像生成模型大语言模型多模态

一种基于瞬时相位不连续性的时频重叠信号分离方法

信号动量轮重构模块包络连续点

一种基于大语言模型语义解析的装备制造供应链风险传播预警方法

风险节点大语言模型情景预警方法

一种面向生成式大语言模型拆分学习的数据重构攻击防御方法

站点导航

APP 下载