摘要
本发明公开了基于源码预训练模型的鲁棒性验证方法、系统及存储介质,其方法包括步骤:获取模型并提取代码数据特征得到令牌序列;对令牌序列进行切片处理;采样令牌序列切片并进行重组得到随机令牌序列;设计分类损失函数并对大型预训练模型进行微调;将随机令牌序列作为大型预训练模型的输入得到模型预测的分类标签;根据多次模型预测得到的分类标签计算分类的自信度并得到大型预训练模型的输出预测;构建基于编辑距离的新令牌序列;根据预测标签自信值的界限和二分法计算鲁棒半径。本发明解决了现有方法在源代码场景中复杂扰动使得现有随机平滑方法难以统一建模导致大型预训练语言模型无法针对各类特征做精细处理从而难以保证鲁棒性的问题。
技术关键词
预训练模型
鲁棒性验证方法
令牌
标签
序列切片
预测类别
语法模型
序列特征
预训练语言模型
编辑
平滑方法
元素
验证系统
计算机
可读存储介质
程序
存储器
系统为您推荐了相关专利信息
身份识别方法
半监督学习
图像
卷积神经网络模型
标签训练集
话题
趋势预测方法
邻居
多元线性回归模型
状态转换概率
仿真模型
锂电池故障
溯源方法
故障传播路径
物理
标签读写器
代码生成系统
数据储存模块
产品生产线
密钥