摘要
本发明涉及源代码漏洞检测技术等领域,公开了一种基于EMA Teacher‑Student结构的代码语义对齐方法,有效实现匿名化代码在不暴露敏感信息的前提下,依然具备与原始代码相当的表示能力,从而显著提升下游如漏洞检测等任务的准确率与鲁棒性,包括下述步骤:构建具有相同结构但参数独立的教师模型与学生模型,两者皆统一采用“编码器模块 + Transformer 主干网络”的双模块架构;从开源代码库或/和漏洞数据集中提取得到原始代码样本,随后对原始代码样本执行匿名化操作;学生模型处理经匿名化操作后得到的匿名化代码样本,生成被 Mask 的帧级嵌入和全局嵌入两类输出语义表示;教师模型处理原始代码样本,生成原始语义表示的帧级嵌入和全局嵌入两类输出语义表示。
技术关键词
对齐方法
学生
教师
编码器模块
样本
参数
漏洞检测技术
传播算法
误差反向传播
字符串替换
深度学习框架
代码结构
标识符
语义向量
网络
模型更新
符号
格式
系统为您推荐了相关专利信息
测试平台
测试适配器
功能模块
参数测试系统
GPIO引脚
密钥共享技术
接收端
无线感知系统
导频信号
发射端
问答机器人
错误检测方法
计算机可执行指令
错误检测装置
指标