结合双重代码表征的补丁过拟合评估方法

正文

推荐专利

结合双重代码表征的补丁过拟合评估方法

申请号：CN202510169305

申请日期：2025-02-17

公开号：CN120123208A

公开日期：2025-06-10

类型：发明专利

摘要

本发明涉及结合双重代码表征的补丁过拟合评估方法，属于互联网安全服务领域。本发明针对自动化补丁生成情况，首先构建缺陷代码片段、正确代码片段、补丁的CFG与AST，利用Word2Vec模型分别生成含结构信息、语义信息的嵌入向量；其次利用Transformer模型对AST嵌入向量、GAT模型对CFG嵌入向量进行编码，拼接得到特征向量；然后计算补丁和缺陷代码片段、正确代码片段的特征向量距离，训练生成二分类模型用于计算补丁过拟合置信度；最后依据代码变更度对该置信度加权，再与阈值比较判断是否过拟合。本发明针对现有方法中缺陷和正确代码片段的语义相似性高、代码变化程度大时易造成误判，增加代码CFG特征和计算代码变更度提升补丁过拟合评估的准确率。

技术关键词

Word2Vec模型补丁编码器逻辑回归算法二分类模型机器学习模型注意力因子语义节点元素网络数据编辑文本序列阶段

系统为您推荐了相关专利信息

一种敏感词确定方法、装置及电子设备

样本字符同义词超文本标记语言电子设备

CT图像目标特征的分类方法、装置、电子设备及存储介质

分类网络分类方法文本编码器分支报告

航天电机整机在轨自适应最小启动力矩测量方法及装置

力矩测量方法实测电流误差 Q算法航天

面向智能制造的施工过程碳排放预测方法

排放预测方法稀疏特征拉普拉斯噪声非线性动态

基于DiT条件引导的多标签天气图像数据扩充方法

多标签数据扩充方法天气图像混合损失函数

结合双重代码表征的补丁过拟合评估方法

站点导航

APP 下载