一种基于EMA Teacher-Student结构的代码语义对齐方法

正文

推荐专利

申请号：CN202510906485

申请日期：2025-07-02

公开号：CN121029173A

公开日期：2025-11-28

类型：发明专利

摘要

本发明涉及源代码漏洞检测技术等领域，公开了一种基于EMA Teacher‑Student结构的代码语义对齐方法，有效实现匿名化代码在不暴露敏感信息的前提下，依然具备与原始代码相当的表示能力，从而显著提升下游如漏洞检测等任务的准确率与鲁棒性，包括下述步骤：构建具有相同结构但参数独立的教师模型与学生模型，两者皆统一采用“编码器模块 + Transformer 主干网络”的双模块架构；从开源代码库或/和漏洞数据集中提取得到原始代码样本，随后对原始代码样本执行匿名化操作；学生模型处理经匿名化操作后得到的匿名化代码样本，生成被 Mask 的帧级嵌入和全局嵌入两类输出语义表示；教师模型处理原始代码样本，生成原始语义表示的帧级嵌入和全局嵌入两类输出语义表示。

技术关键词

对齐方法学生教师编码器模块样本参数漏洞检测技术传播算法误差反向传播字符串替换深度学习框架代码结构标识符语义向量网络模型更新符号格式

系统为您推荐了相关专利信息

视频风险预测方法及相关装置

视觉特征信息融合特征视频帧图像文本

产业链图谱构建方法、装置、设备、存储介质及程序产品

图谱构建方法分词节点企业知识图谱技术

一种MCU参数测试系统与测试方法

测试平台测试适配器功能模块参数测试系统 GPIO引脚

基于CSI混淆的隐私保护无线感知方法及系统

密钥共享技术接收端无线感知系统导频信号发射端

一种智能问答的错误检测方法、装置、设备及介质

问答机器人错误检测方法计算机可执行指令错误检测装置指标

一种基于EMA Teacher-Student结构的代码语义对齐方法

站点导航

APP 下载