摘要
本申请属于计算机技术领域,具体公开了一种基于多模态的代码结构融入大模型方法及系统,该方法包括:获取代码文本对应的代码属性图;输入代码属性图至图编码器,获取图编码器输出的图结构表示;输入代码文本和图结构表示至大语言模型,获取大语言模型输出的代码处理结果,大语言模型用于基于代码文本和图结构表示,按照代码处理任务对代码进行处理;其中,图结构表示与序列化语言表示在表征空间保持对齐,序列化语言表示是大语言模型中的文本编码器对代码文本进行序列化处理获取的。本申请通过引入多模态编码器,能够将代码的不同模态信息,如语法、语义、控制流、数据流等进行融合与处理,能够显著提升大模型对代码结构的理解能力。
技术关键词
代码结构
大语言模型
多模态
生成代码
文本编码器
编码器参数
抽象语法树
解析工具
开源代码库
两阶段
信息处理模块
可读存储介质
存储计算机程序
处理器
存储器
样本
系统为您推荐了相关专利信息
人脸识别方法
姿态校正
轻量化神经网络
三元组损失函数
数据隐私保护
指数
智慧农业系统
农作物生长周期
传感
多模态数据融合
智能监督
文本特征向量
图像特征向量
校验系统
校验方法