摘要
公开了一种语料检索方法、装置、集群、存储介质及程序产品,涉及计算机技术领域。通过充分利用文件在数据库中的路径信息,实现了提高语料检索的准确度,进而实现改善大语言模型的推理效果。该方法包括:获取第一文件位于第一数据库中的第一路径信息,第一文件中包括目标文本,目标文本用于表征用户需要通过大语言模型LLM生成的代码所具有的业务功能;获取第一路径信息与语料库中各路径信息之间的第一相似度;确定第一相似度符合第一阈值范围的第二路径信息对应的目标语料,目标语料中包括与目标文本之间相似度符合第二阈值范围的文本,并且目标语料用于辅助LLM生成具有业务功能的代码。
技术关键词
检索方法
文本
大语言模型
目录
计算机程序产品
模块
集群
可读存储介质
检索装置
指令
存储器
处理器