摘要
本发明提出了一种基于自适应数据分块和GPT‑4o融合预处理技术的智能合约漏洞检测方法,用于解决现有智能合约漏洞检测方法检测效率低且准确性差的技术问题。本发明的步骤为:利用大模型GPT‑4o对输入的数据合约源代码进行数据增强,将数据增强后的代码映射为Token序列;利用自适应长度和语义的数据切分方法对Token序列进行长度处理,得到多个Token片段;利用多个并行设置的CodeBERT模型构建mcCodeBERT网络模型,利用mcCodeBERT网络模型对多个Token片段进行特征提取,得到嵌入向量;利用文本分类方法对嵌入向量进行分类,得到存在漏洞的概率。本发明只需要智能合约源代码就可以进行高效的特征提取并进行检测,可以更加高效地帮助检测数据长度过长的漏洞。
技术关键词
预处理技术
数据切分方法
文本分类方法
分块
语义
Softmax函数
序列
模块
智能合约漏洞
智能合约代码
多头注意力机制
标识符
代码切片
对源代码
字符
网络
系统为您推荐了相关专利信息
测试用例生成程序
生成方法
自然语言
测试用例生成装置
分块
智控系统
智控方法
协议管理器
视频帧特征
机器人
激光打标设备
智能调控系统
激光设备
环境温度值
特征提取单元
医学图像分割网络
多尺度
分支
多级解码器
注意力
语音通信系统
信号预处理模块
语义特征提取
信号采集模块
高层语义信息