摘要
本发明涉及源代码漏洞检测技术等领域,公开了一种上下文敏感的权重聚合源代码特征提取方法,有效地提取了代码的控制流特征信息、语义信息和文本信息,使用joern工具初步解析源代码文件,得到对应的代码属性图和程序依赖图;从代码属性图中提取控制流对应的源代码行作为源代码的控制流特征;对程序依赖图进行三种不同的中心性分析,得到三种中心性分析的分数并取平均值;将控制流特征和中心性分析结果进行对齐,源代码的每行控制流都对应着中心性分析的最终分数;根据控制流的中心性分析的最终分数进行从大到小排序;根据每个控制流文件对应的源代码是否有漏洞,将每个控制流标记为0或者为1;以json形式保存到本地,作为模型训练的数据集。
技术关键词
特征提取方法
程序依赖图
结点
标识符
漏洞检测技术
打标签
有向图结构
代码特征
数值
键值
字典
格式
数据
标记
关系
字符
语义
冗余
文本
系统为您推荐了相关专利信息
网格
评估指标体系
融合计算方法
加权融合算法
数据存储结构
存储服务系统
存储系统
构造数字证书
树根
有效性
标识符
电池温度保护
电源管理模块
整车蓄电池
变量
无线通信资源
动态分配方法
通信节点
动态分配装置
队列