摘要
本申请提供了一种代码复杂缺陷检测模型的构建方法及装置,其中,方法包括:基于静态分析工具和未训练的大语言模型进行知识互蒸馏,构建包括代码片段和复杂缺陷标签的数据集;使用静态提取工具抽取代码片段中的事件和关系,构建谓词事件关系图,并使用谓词事件关系图和复杂缺陷标签训练图注意力网络,通过训练完毕的图注意力网络输出风险路径子图;将风险路径子图和代码片段作为大语言模型的输入指令,采用双流编码器结构交互指导,借助缺陷规则链引导模型推理,并使用监督微调方式调整大语言模型参数,通过训练完毕的大语言模型输出复杂缺陷结果;将训练完毕的图注意力网络和大语言模型共同构建为复杂缺陷检测模型。
技术关键词
缺陷规则
大语言模型
分析工具
编码器结构
标签
文本
关系
蒸馏
自然语言
序列
网络
节点特征
注意力机制
高风险
可读存储介质
处理器