摘要
本发明公开了一种基于大模型增强优化与重排序的零样本代码搜索方法,首先利用大模型生成原始查询语句和原始代码片段的多个等价的增强代码,并由预训练模型编码后聚合为增强嵌入向量,然后分别计算增强前后嵌入向量的跨模态相似度;接下来对增强前后的相似度变化进行平滑处理,以减少大模型的生成偏好对真实语义的过度影响;随后基于大模型重排序的两阶段搜索策略,对初步搜索结果中靠前k个代码进行按语义匹配程度强弱的重新排序,精准区分目标代码与相似代码,协助模型提高搜索结果的准确性。
技术关键词
原始查询语句
代码搜索方法
大语言模型
预训练模型
样本
模版
生成代码
生成自然语言
摘要
搜索系统
语义
代码库
编码模块
列表
元素
数据
策略
指标
系统为您推荐了相关专利信息
注意力机制
多尺寸
置信度阈值
视频流
多尺度特征
状态监测数据
设备状态预测
待测参数
特征提取模型
量子态