多视角对比学习跨语言源代码表示方法

正文

推荐专利

多视角对比学习跨语言源代码表示方法

申请号：CN202510168743

申请日期：2025-02-17

公开号：CN120144100B

公开日期：2025-11-11

类型：发明专利

摘要

本发明涉及多视角对比学习跨语言源代码表示方法，属于计算机软件信息技术领域。本发明首先利用元学习方法根据编程语言类型初始化Transformer可学习参数；其次依赖源代码片段的语法、结构等信息构建代码特征异构图，使用GCN对异构图进行聚合得到图节点嵌入；然后依据元路径对节点同跳邻域信息进行聚合得到图节点的序列化表示，使用Transformer和层级注意力机制生成图节点嵌入；最后根据两种视角下的节点嵌入建立对比损失函数，训练生成跨语言源代码表示模型。本发明针对现有方法应用编程语言通用代码特征影响表示效果和模型出现过平滑问题，提取编程语言特定信息并利用多视角图节点嵌入构建模型，提升了跨语言代码表示效果，提高了代码摘要、源代码漏洞检测等准确率。

技术关键词

代码特征元学习方法注意力机制计算机软件信息技术多视角邻居异构程序依赖图层级抽象语法树投影特征对源代码邻域节点特征语义参数

系统为您推荐了相关专利信息

一种基于深度学习的刺绣针法识别方法

刺绣数据刺绣针法通道注意力机制 Gabor滤波器图片

一种图像风格转换方法及设备

图像风格转换方法点云特征视觉特征语义特征计算机可读指令

一种基于Sinc滤波器的运动想象脑电信号解码方法及系统

运动想象脑电信号滤波器解码方法脑电特征时域特征提取

一种基于多联级抓取网络框架的3D打印产品分拣系统

产品分拣系统抓取网络实例分割算法粒子群算法机械臂抓取轨迹

一种毫米波安检仪健康管理方法及系统

安检仪健康管理方法注意力机制强化学习算法子系统

多视角对比学习跨语言源代码表示方法

站点导航

APP 下载