摘要
本发明公开了一种基于LLM增强的数据集和AST层次感知模型来增强代码摘要的方法,该方法能够自动为代码生成自然语言描述的摘要,涉及软件工程领域。首先提出了一种融合代码质量评估与优化的创新方法,该方法通过基于代码质量反馈的提示工程机制实现大语言模型在生成过程中自动修正数据集中代码缺陷,用于后续模型训练。然后基于AST设计具有层次语义保持能力的有向语法图(DSG),并提出层次感知的代码摘要模型(HiSum),通过有向图卷积网络(dirGCN)实现语法层次结构编码。然后将有向语法图编码表示馈送到具有注意力复制机制的解码器中生成代码摘要。本发明在Java和Python数据集上的大量实验证明了我们所提出模型的有效性。
技术关键词
摘要
解码器
生成代码
邻居
抽象语法树
编码器
注意力
语义
节点
代码缺陷
数据
语法特征
代码结构
对源代码
大语言模型
非线性
结点
模块
自然语言
系统为您推荐了相关专利信息
分布式协同
混合通信模块
同步控制模块
部署算法
控制系统
图像去雾方法
图像去雾模型
卷积模块
雷达点云数据
多模态