摘要
本申请涉及一种基于知识蒸馏优化的开源软件供应链安全领域专用语义双向编码器方法。所述方法包括:获取开源软件供应链的安全数据;将安全数据输入至预训练的学生模型中,得到开源软件供应链的安全分析结果;安全分析结果包括漏洞检测结果;预训练的学生模型为根据样本安全数据、第一样本标签和第二样本标签训练得到的语言模型;第一样本标签为多个教师模型根据样本安全数据输出的样本语义理解结果,第二样本标签为样本漏洞检测结果;多个教师模型包括对通用语言进行语义理解的第一教师模型、对安全文本进行语义理解的第二教师模型和对代码进行语义理解的第三教师模型。采用本方法能够提高开源软件供应链的安全分析准确率。
技术关键词
知识蒸馏优化
样本
教师
编码器方法
标签
学生
软件
语义向量
数据
漏洞
编码器装置
文本
特征提取网络
计算机程序产品
处理器
注意力机制
计算机设备
分析模块