摘要
本发明提供了一种基于多粒度特征融合的代码摘要生成方法,包括:步骤1,对数据集中样本进行预处理操作,获取代码整体语义信息;步骤2,搭建源代码多粒度特征编码器,基于词元序列、抽象语法树和控制流图三种粒度特征的数据规模和数据结构差异,获得各个粒度特征的上下文向量;步骤3,对不同粒度特征编码器的输出实现粒度特征融合;步骤4,将融合后所得到的词元序列融合特征与控制流图融合特征输入到基于Transformer的解码器中,输出当前时间步预测单词,并最终组成摘要。本发明所公开的基于多粒度特征融合的代码摘要生成方法,能有效提取源代码关键特征并尽量减少计算开销,并且有效缓解特征序列的长距离依赖问题。
技术关键词
代码摘要生成方法
多粒度特征
抽象语法树
编码器
代表
矩阵
节点特征
融合特征
解码器
注意力
索引
对源代码
序列特征
树形结构
自然语言
模型预训练
关系
代码特征
系统为您推荐了相关专利信息
预测分析系统
ARIMA模型
数据
生成式对抗网络
多项式
PID控制算法
智能伺服驱动器
磁场定向控制
速度反馈信号
三环控制算法
情报板
图像识别方法
算法模型
文本识别
识别特征
城市功能区识别方法
神经网络模型
时空融合特征
特征提取模块
影像
北斗基站
布设方法
深度特征提取网络
深度强化学习
无监督聚类分析