一种代码预训练模型未授权数据的检测方法

正文

推荐专利

一种代码预训练模型未授权数据的检测方法

申请号：CN202411469721

申请日期：2024-10-21

公开号：CN119357926B

公开日期：2025-11-07

类型：发明专利

摘要

本发明公开了一种代码预训练模型未授权数据的检测方法，包括以下步骤：S1、对代码数据进行采样及预处理；S2、针对代码的目标模型，训练一个影子模型来模拟目标模型的行为；S3、采用信号抽取器，提取代码的目标模型和影子模型的预训练任务的信号，针对不同预训练任务的损失，作为后续加权分类模型的特征输入，用于后续的推理；S4、采用难易度矫正模型，对信号抽取器输出的信号进行难易度矫正，用于使信号抽取器输出的信号不受样本难易度的干扰；S5、采用加权分类模型学习信号抽取器的输出信号及难易度矫正模型矫正后的多种信号，并给出预训练模型是否使用过某条未授权数据的判断。

技术关键词

矫正模型预训练模型抽取器数据信号样本多层感知机注意力机制超参数网络校准噪声

系统为您推荐了相关专利信息

基于Dynamo提取道路设计中心线的三维建模方法

三维建模方法中心线生成道路曲线数据

一种用于PLC程序脆弱性分析的协议模糊测试方法

协议模糊测试方法大语言模型报文字段语义库

一种用于动作分类的多视图脑肌电融合解码方法

解码方法短时傅里叶变换 3DCNN模型通道信号

一种基于反事实实例的因果解释方法及系统

连续性连续特征分类特征生成方法解释系统

基于自适应匹配的保护信息通讯数据库建模方法及系统

数据库建模方法参数索引通讯接收设备

一种代码预训练模型未授权数据的检测方法

站点导航

APP 下载