摘要
本发明公开了一种基于深度学习的程序源代码自动化漏洞修复方法,旨在提升修复准确性与效率,尤其适用于大规模复杂软件系统。方法包含预处理、训练及预测与修补三个关键阶段。在预处理阶段,提取代码定义‑使用链并优化代码语义理解。训练阶段采用Transformer‑XL模型,先在通用bug修复数据集上预训练,再在漏洞修复数据集上微调,确保模型处理长代码序列并保持上下文连续性。在预测与修补阶段,利用Transformer‑XL分析代码并生成潜在修复方案,结合语法检查和静态分析以确保补丁质量。本发明提供了适应多种软件环境的自动化漏洞修复方案,增强了模型对复杂代码结构的理解,提升了实际应用中的可靠性与实用性。
技术关键词
漏洞修复方法
阶段
易受攻击文件
字符串替换
训练数据量
通用特征
代码结构
连续性
补丁
序列
数据格式
程序
令牌
重构
语义
变量
机制