基于大语言模型分类与原型集成的代码搜索方法、系统及设备

正文

推荐专利

申请号：CN202510438207

申请日期：2025-04-09

公开号：CN119961381B

公开日期：2025-09-12

类型：发明专利

摘要

本发明公开了基于大语言模型分类与原型集成的代码搜索方法、系统及设备，涉及代码语义分析技术领域，步骤如下：S01、清洗待处理语料段并提取查询源Token和代码源Token，得到清洗后的“查询‑代码”源Token对；S02、使用大语言模型对其进行分类；S03、将所述不同类别的“查询‑代码”源Token对输入到预训练模型中进行模型训练，得到不同类别的专家模型；S04、利用专家模型分别进行代码搜索，得到初步搜索结果；S05、筛选初步搜索结果；S06、对所述筛选后的代码搜索结果进行集成，得到最终的搜索结果。本发明采用上述方法、系统及设备，能够有效地缩小查询与代码之间的语义差距，解决模棱两可的查询可能导致的语义模糊性的问题，从而提高代码搜索的性能。

技术关键词

大语言模型代码搜索方法原型样本多模态集成方法集成模块表达式预训练模型焦点语义分析技术锚点搜索系统数据处理模块搜索模块数据分类标签处理器

系统为您推荐了相关专利信息

点焊机器人路径确定方法、装置、计算机设备、存储介质和计算机程序产品

点焊机器人焊点样本计算机程序产品聚类

输电线路故障诊断方法、模型训练方法、装置及电子设备

染色体模型训练方法输电线路故障诊断松弛遗传算法

多模态的心理健康预测方法、电子设备及介质

视觉特征提取视频帧特征心理健康检测表情特征动作特征

一种基于多模态数据的变电站设备异常检测系统与方法

变电站设备异常事件多模态异常检测系统模态特征

一种基于知识驱动的燃气发电设备资产树构建方法

燃气发电设备树构建方法大语言模型资产表格

基于大语言模型分类与原型集成的代码搜索方法、系统及设备

站点导航

APP 下载