摘要
本发明公开了一种代码预训练模型未授权数据的检测方法,包括以下步骤:S1、对代码数据进行采样及预处理;S2、针对代码的目标模型,训练一个影子模型来模拟目标模型的行为;S3、采用信号抽取器,提取代码的目标模型和影子模型的预训练任务的信号,针对不同预训练任务的损失,作为后续加权分类模型的特征输入,用于后续的推理;S4、采用难易度矫正模型,对信号抽取器输出的信号进行难易度矫正,用于使信号抽取器输出的信号不受样本难易度的干扰;S5、采用加权分类模型学习信号抽取器的输出信号及难易度矫正模型矫正后的多种信号,并给出预训练模型是否使用过某条未授权数据的判断。
技术关键词
矫正模型
预训练模型
抽取器
数据
信号
样本
多层感知机
注意力机制
超参数
网络
校准
噪声
系统为您推荐了相关专利信息
解码方法
短时傅里叶变换
3DCNN模型
通道
信号