摘要
本发明公开了一种基于语义拓扑与消歧冗余修剪的检索增强仓库级代码补全方法。首先通过特定切片算法构建源代码片段与诱导子图精确映射的键值代码库;在检索阶段,采用四级分层优化,通过提取深层语义关系、修剪精确的重复项、用一种新的基于图的度量来评估结构相似性(根据拓扑重要性对编辑进行权衡),以及重新排序结果以最大化相关性和多样性,系统地细化候选项,解决检索冗余固化和表面相似误导问题,同时通过外部感知标识符消歧器解析跨模块依赖,解决了跨文件符号歧义问题;最终融合优化结果生成提示符驱动LLM产生更优质的输出。本发明通过对语义和结构信号的协调,使得即使在大型、资源受限的代码库中也能获得强大的性能。同时,该设计允许它与其他跨文件方法正交互补,在组合使用时提供协同改进。
技术关键词
代码补全方法
标识符
语义
冗余
分层特征
实体
资源库
仓库
切片算法
代码库
语句
大语言模型
分解算法
键值
度量
文件扩展名
生成提示词
模块方法
程序切片
解析机制