摘要
本发明提供了一种基于长尾增量学习的软件漏洞类型识别方法,属于软件工程技术领域。解决了现有方法在应对动态数据流时,面临灾难性遗忘和长尾问题而导致漏洞类型识别精度下降的技术问题。其技术方案为:包括以下步骤:(1)搜集漏洞类型识别数据集,并按照漏洞发布的时间进行任务划分;(2)使用混合回放来从旧任务数据中选出典型漏洞样本;(3)设计混合提示模板及映射方法,融合源代码和漏洞描述,输入到CodeT5进行模型和提示模板训练;(4)引入EWC正则化项;(5)借助混合提示模板融合漏洞代码和描述来预测漏洞类型。本发明的有益效果为:缓解灾难性遗忘和长尾问题。
技术关键词
样本
识别方法
映射方法
模板
对源代码
训练神经网络模型
协方差矩阵
软件工程技术
生成自然语言
预训练语言模型
参数
漏洞数据库
随机梯度下降
计算方法
定义
标签