摘要
本发明属于软件工程技术领域,具体为轻量压缩上下文生成的代码快速修复方法。本发明通过构建“检索‑压缩‑生成”协同架构实现高效修复;包括:构建跨文件代码检索数据库,设计轻量语义压缩编码器(SCE),将检索到的跨文件代码块压缩为高语义密度的短令牌;并通过两阶段训练策略实现与大语言模型(LLM)的语义兼容;其中,语义对齐阶段训练SCE使压缩令牌可被LLM准确解析,任务对齐阶段微调LLM以利用压缩令牌完成修复。实验表明,本发明在保留关键逻辑依赖的前提下,可加速模型的推理效率,并保证代码修复的效果,适用于大型代码仓库的跨文件依赖修复场景,可集成于集成开发环境插件、自动化代码审计工具等,显著提升软件开发与维护效率。
技术关键词
令牌
压缩编码器
语义向量
预训练模型
修复方法
代码仓库
两阶段
投影器
语法检查器
软件工程技术
逻辑
集成开发环境
语义特征提取
语法分析器
审计工具
参数
序列
系统为您推荐了相关专利信息
红树林
卫星遥感影像
非线性回归模型
模型计算方法
生态修复方法
语义特征
在线学习机制
注意力机制
日志监控方法
数据
网站分类方法
多源融合
网站静态资源
网址
特征提取模块
语义向量
日志异常检测方法
序列
门控循环单元
样本