摘要
本发明公开了一种基于大模型增强优化与重排序的零样本代码搜索方法,首先利用大模型生成原始查询语句和原始代码片段的多个等价的增强代码,并由预训练模型编码后聚合为增强嵌入向量,然后分别计算增强前后嵌入向量的跨模态相似度;接下来对增强前后的相似度变化进行平滑处理,以减少大模型的生成偏好对真实语义的过度影响;随后基于大模型重排序的两阶段搜索策略,对初步搜索结果中靠前k个代码进行按语义匹配程度强弱的重新排序,精准区分目标代码与相似代码,协助模型提高搜索结果的准确性。
技术关键词
原始查询语句
代码搜索方法
大语言模型
预训练模型
样本
模版
生成代码
生成自然语言
摘要
搜索系统
语义
代码库
编码模块
列表
元素
数据
策略
指标
系统为您推荐了相关专利信息
修复方法
子模块
感知损失函数
采样模块
收集训练数据
BP神经网络模型
数学模型
煤矿工作面开采
参数
预测系统