摘要
本发明涉及数据处理技术领域,揭露了一种基于Transformer神经网络架构的虚拟化代码还原方法、设备及介质,包括:将预训练代码语料中的虚拟化代码及原始代码合并为代码语料库;将代码语料库划分为训练数据集、调整数据集及验证数据集;对训练数据集中的代码数据进行分词,生成多个代码分词,且每个代码分词对应唯一标识符,生成唯一标识符对应的代码向量空间;对Transformer神经网络进行虚拟化代码及原始代码之间对应关系的学习,得到代码逆向大模型;根据调整数据集对代码逆向大模型进行参数调整,根据验证数据集对参数调整后的代码逆向大模型进行归纳验证,利用验证后的代码逆向大模型将目标虚拟化代码还原为原始代码。本发明可以提高虚拟化代码还原时的准确性。
技术关键词
神经网络架构
还原方法
分词
标识符
文本
矩阵
前馈神经网络
参数
数据处理技术
注意力
电子设备
处理器通信
浮点数
算法
字符
可读存储介质
索引
关系
系统为您推荐了相关专利信息
自动编制方法
神经网络模型
BERT模型
自定义实体
语义向量
模板
业务处理过程
软件
语句
非易失性计算机存储介质