一种代码预训练模型未授权数据的检测方法

AITNT
正文
推荐专利
一种代码预训练模型未授权数据的检测方法
申请号:CN202411469721
申请日期:2024-10-21
公开号:CN119357926B
公开日期:2025-11-07
类型:发明专利
摘要
本发明公开了一种代码预训练模型未授权数据的检测方法,包括以下步骤:S1、对代码数据进行采样及预处理;S2、针对代码的目标模型,训练一个影子模型来模拟目标模型的行为;S3、采用信号抽取器,提取代码的目标模型和影子模型的预训练任务的信号,针对不同预训练任务的损失,作为后续加权分类模型的特征输入,用于后续的推理;S4、采用难易度矫正模型,对信号抽取器输出的信号进行难易度矫正,用于使信号抽取器输出的信号不受样本难易度的干扰;S5、采用加权分类模型学习信号抽取器的输出信号及难易度矫正模型矫正后的多种信号,并给出预训练模型是否使用过某条未授权数据的判断。
技术关键词
矫正模型 预训练模型 抽取器 数据 信号 样本 多层感知机 注意力机制 超参数 网络 校准 噪声
系统为您推荐了相关专利信息
1
基于Dynamo提取道路设计中心线的三维建模方法
三维建模方法 中心线 生成道路 曲线 数据
2
一种用于PLC程序脆弱性分析的协议模糊测试方法
协议模糊测试方法 大语言模型 报文 字段 语义库
3
一种用于动作分类的多视图脑肌电融合解码方法
解码方法 短时傅里叶变换 3DCNN模型 通道 信号
4
一种基于反事实实例的因果解释方法及系统
连续性 连续特征 分类特征 生成方法 解释系统
5
基于自适应匹配的保护信息通讯数据库建模方法及系统
数据库建模方法 参数 索引 通讯 接收设备
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号