一种基于Transformer模型的代码生成和代码注释的双重模型方法

正文

推荐专利

申请号：CN202410949071

申请日期：2024-07-16

公开号：CN118917327A

公开日期：2024-11-08

类型：发明专利

摘要

本发明公开了一种基于Transformer模型的注释生成和代码生成的双重模型方法，涉及机器翻译技术领域，其特征在于：包括以下步骤：(1)数据处理：将输入的代码和注释文档转换为固定大小的矩阵；(2)输入表示；(3)设置超参数，在训练过程中对损失函数的重要性进行加权；(4)预训练：使用LSTM模型对代码集合X和代码Y进行回归任务，得到代码先验概率P(x)和注释先验概率P(y)；(5)双重任务迭代训练；(6)输出。使用Transformer模型组合搭建双重模型架构能很好的平衡了注释生成和代码生成任务之间性能，并且解决了长依赖问题；在Transformer模型的基础上采用注释生成和代码生成之间的概率相关作为正则化项，并采用一种基于注意力的约束来保证在训练过程中两个模型的注意权重的相似性。

技术关键词

矩阵注意力超参数解码器机器翻译技术编码器数据序列自然语言 LSTM模型元素优化器阶段特征工程关系语义索引文本基础样本

系统为您推荐了相关专利信息

基于大语言模型的网络协议栈跨层交互式安全分析方法

智能代理系统漏洞大语言模型深层语义匹配命名实体识别技术

油藏开发晚期基于差异化剩余油分布的井网部署方法

剩余油网格配置计算方法原油体积系数饱和度

一种基于动态随机森林与特征压缩器的云边协同推理方法

推理方法压缩器动态任务调度器网络监视器 DNN模型

手术机器人的主从运动控制方法及相关设备

手术机器人运动控制方法关节参数雅可比矩阵

语义信息的生成方法和装置、存储介质及电子装置

自然语言指令生成方法编码向量语义

一种基于Transformer模型的代码生成和代码注释的双重模型方法

站点导航

APP 下载