摘要
本发明提出了一种基于多算法融合的混合检索方法、系统、设备及存储介质,该方法包括:获取各类型文档数据,对文档数据进行预处理,获得纯文本数据;将纯文本数据切分为多个块节点数据,并使用大语言模型对每个块节点数据生成多个衍生问题;对块节点数据和衍生问题进行向量化编码,并存储于向量数据库中;接收用户查询问题,使用大语言模型为查询问题生成多个相关的预设问题;将查询问题及其预设问题转化为向量形式,执行关键词检索和向量检索,在向量数据库中获取对应的候选结果;通过加权倒数重排算法对候选结果进行加权融合,获取最相关的检索数据。本发明能够提升信息检索的效率和结果的相关性,满足用户在复杂语义场景下的检索需求。
技术关键词
混合检索方法
多算法融合
大语言模型
JSON格式数据
节点
文本
关键词
命名实体识别技术
答案
检索算法
标签
语义场景
可读存储介质
检索系统
处理器
信息检索
系统为您推荐了相关专利信息
雷达信号分选方法
广义正交匹配追踪算法
矩阵
脉冲
特征值
成票方法
文本
大语言模型
计算机可执行指令
电力系统
临边洞口
洞口作业
神经网络模型
计算机可读取存储介质
高风险
模型识别方法
大语言模型
模块
分类策略
计算机程序产品