摘要
本发明公开了一种RAG增强检索方法、系统、设备及程序,所述方法包括:构建包含多种类型数据的大规模语料库,并对所述大规模语料库进行预处理;对RAG模型进行预训练;基于预训练的RAG模型对查询语句进行编码,得到查询向量;基于所述查询向量与所述大规模语料库中的文本向量进行相似度得分计算,将分值最高的文本作为检索结果。通过本公开的处理方案,通过改进RAG模型的预训练任务和优化检索策略,提高了检索精度和泛化能力。
技术关键词
大规模语料库
检索方法
文本
融合上下文信息
命名实体识别模型
计算机程序产品
分词
格式化
语句
学生
多头注意力机制
语义
教师
检索策略
检索系统
处理器
编码
学习方法
系统为您推荐了相关专利信息
三元组
运维知识图谱
语义
分词
知识图谱构建技术
大语言模型
子系统
信息处理系统
自然语言信息
信息处理方法
大语言模型
融合特征
交叉注意力机制
高维特征向量
医疗数据处理技术
特征识别方法
图像处理
特征识别系统
多尺度特征提取
集成学习模型