基于Transformer语言模型的源代码漏洞检测方法及系统

正文

推荐专利

申请号：CN202410916122

申请日期：2024-07-09

公开号：CN118886016A

公开日期：2024-11-01

类型：发明专利

摘要

本发明涉及互联网安全技术领域，特别涉及一种基于Transformer语言模型的源代码漏洞检测方法及系统，获取代码样本数据，并对代码样本数据中的漏洞类型标注类别标签，以构建漏洞检测样本数据集；构建多分类CodeBERT模型，并利用漏洞检测样本数据集对多分类CodeBERT模型进行训练，将训练后的多分类CodeBERT模型作为漏洞检测目标模型，其中，所述多分类CodeBERT模型基于RoBERTa分词器和Transformer语言模型构建；将待检测的源代码输入至漏洞检测目标模型中，利用漏洞检测目标模型识别并输出待检测源代码中的漏洞类别。本发明能够充分考虑源代码的深层语义、结构、语法特征，利用微调后的模型较好的标源代码漏洞挖掘检测，在软件安全领域具有较好的应用前景。

技术关键词

样本数据模型训练模块互联网安全技术标签漏洞检测系统生成自然语言标记序列语法特征可读存储介质生成代码语义注意力机制输出特征策略处理器

系统为您推荐了相关专利信息

一种物联网的板件入库方法、系统及存储介质

板件组合入库方法打印图像数据家具板件电子标签

一种高精地图数据处理方法、装置、存储介质及处理器

地图数据处理方法曲线频率高精地图数据地图数据处理装置

基于区块链的绿色能源交易数据监控系统

绿色能源交易数据监控系统市场动态决策树模型代表

基于分割模型与连通域生成算法的DAS微地震事件检测方法

事件检测方法地震生成算法语义分割模型置信度阈值

一种基于三维熵评估的问答处理方法、系统、设备及介质

语义图谱样本大语言模型语义分析模型实体

基于Transformer语言模型的源代码漏洞检测方法及系统

站点导航

APP 下载