摘要
本申请公开了一种程序信息生成模型训练方法、装置、电子设备,属于计算机技术领域。所述方法包括:基于第一训练数据集,训练程序信息生成模型的编码器,编码器用于对输入的程序信息对中的代码和注释分别进行特征提取和对齐处理,得到代码向量和文本向量;基于训练得到的编码器对第一训练数据集中的程序信息对进行编码处理,得到每对程序信息对对应的文本向量和代码向量;基于文本向量和代码向量训练程序信息生成模型的解码器;基于训练得到的编码器和解码器,构造程序信息生成模型。本方法由于采用了注释和代码的特征对齐进行特征提取,使得模型在特征提取时得到的代码和注释特征极大程度上能映到同一空间,提升了模型基于注释生成代码的正确率。
技术关键词
解码器
程序
生成模型训练方法
文本
代码特征
数据
编码器训练
模型训练装置
电子设备
特征提取器
生成代码
处理器
序列
答案
正确率
可读存储介质
模块