一种源代码表征提取方法

正文

推荐专利

一种源代码表征提取方法

申请号：CN202411040108

申请日期：2024-07-31

公开号：CN118940019A

公开日期：2024-11-12

类型：发明专利

摘要

本发明公开了一种源代码表征提取方法，包括获取源代码数据集，并对数据集进行预处理；基于BERT模型和主成分分析技术PCA，分别对预处理后的数据集中代码行、代码构造进行特征提取，得到第一基本表征向量、第二基本表征向量；基于Multi‑way Tree‑LSTM模型，对代码行的抽象语法树子树特征进行直接提取，得到第三基本表征向量；基于GloVe词嵌入技术和GRU模型，对代码图结构的依赖关系上下文特征进行提取，得到第四基本表征向量、第五基本表征向量；利用注意力机制BiGRU，将得到的基本表征向量进行结合，获得源代码表征。因此，采用上述方法，能够全面地保留源代码中的多方面信息，有利于捕捉代码中存在的潜在漏洞。

技术关键词

上下文特征程序依赖图 BERT模型 LSTM模型主成分分析技术注意力机制数据依赖关系代码切片抽象语法树切片技术序列漏洞字符指针阶段

系统为您推荐了相关专利信息

一种基于差分隐私保护的IGA-LSTM光伏发电功率预测方法及系统

差分隐私保护光伏发电功率预测数据收集模块数据处理模块 LSTM模型

基于LSTM算法的温度预测方法在高原精准农业中的应用

温度预测方法 LSTM算法作物生长监测 LSTM模型历史温度数据

一种用电数据异常检测意图识别方法、装置

意图识别方法自然语言模型融合特征注意力机制计算机可执行程序

基于特征提取与自适应网格优化的数字样机轻量化系统

网格解析单元分析单元数字样机模型包围盒树

基于分数阶常微分神经网络的混沌序列预测方法及气象预测方法

混沌序列预测分数阶混沌系统气象预测方法分数阶Lorenz系统双曲正切函数

一种源代码表征提取方法

站点导航

APP 下载