摘要
本发明公开一种面向RAG的多支路混合平衡检索优化方法及系统,涉及RAG检索技术领域,包括:提取用户问题的语义向量,将问题语义向量与知识库中每一文本的语义向量进行相似性匹配,生成第一候选文本集;提取用户问题中的关键词,经二次过滤后得到关键词列表,通过关键词列表与知识库中每一文本进行关键词匹配,生成第二候选文本集;合并第一、第二候选文本集并去重,再输入至Reranker模型中,生成第三候选文本集;判断第三候选文本集是否为空,若否则将第三候选文本集作为检索结果输出,反之则进行二次检索,重新确定检索结果并输出;将用户问题和检索结果发送至大语言模型。本发明能够提高RAG检索的准确性,提高用户体验感。
技术关键词
文本
语义向量
关键词
支路
大语言模型
列表
计算机
检索技术
处理器
指令
算法
输出模块
可读存储介质
存储器
电子设备
系统为您推荐了相关专利信息
文本识别方法
语义
重构矩阵
图像
多头注意力机制
智能生成系统
策略
智能体模型
语音识别文本
智能分析模块
对话管理方法
智能客服
语义模板
自动学习系统
自然语言
变电站
二次设备
模糊匹配算法
文件生成方法
SCD文件
语音生成方法
间隔特征
习惯
语音生成模型
统计学方法