摘要
本发明公开了一种基于符号执行轨迹的代码中间表示预训练方法,可以将代码中的控制流展开为符号执行轨迹,在代码中间表示的执行局部提供语义监督信号。本发明通过在控制流图上随机游走将函数展开为符号执行轨迹,限制回边访问次数以避免重复访问循环,并使用符号约束表示控制流转移条件。然后,本发明通过编译优化和代码混淆技术生成语义等价但表示不一致的符号执行轨迹变体,使用对比学习任务学习符号执行轨迹之间的语义等价性。该预训练方法能使代码预训练模型对局部语义的变动有更好的稳健性。
技术关键词
预训练方法
轨迹
图上随机游走
代码混淆技术
符号
语义
预训练系统
神经网络训练
计算机设备
三元组
可读存储介质
预训练模型
标签
指令
处理器
存储器
模块
内存
系统为您推荐了相关专利信息
温度监测方法
电缆材料
电缆表面温度
卡尔曼滤波算法
电缆生产线
拍摄云台
卷绳装置
地形测量方法
采样点
图像分割网络
实弹射击训练
姿势稳定性评估
注意力机制
局部时空特征
三维卷积神经网络
地图构建方法
物体
机器人控制系统
计算机可读取存储介质
图像