摘要
本发明适用机器学习技术领域,提供了一种类代码的代码表征生成方法,该方法包括:采用类级代码数据精简策略对类级源代码文件进行数据精简,得到精简后的第一序列和第二序列,采用基于注意力机制的表征融合策略将第一序列对应的第一向量表示序列和第二序列对应的第二向量表示序列进行表征融合,得到类级源代码文件的代码表征,从而提高了类代码的代码表征的生成质量和有效性,并提高了模型性能。
技术关键词
抽象语法树
序列
融合策略
注意力机制
节点
生成方法
深度优先遍历
文本
机器学习技术
可读存储介质
数据
处理器
算法
生成装置
存储器
计算机
线性
矩阵