摘要
本申请实施例公开了一种基于多模型融合的文本检索方法和系统,该方法包括以下步骤:使用多个向量化模型分别对检索语料进行向量化,得到多个向量化结果;基于每个向量化模型,将检索语料的向量化结果分别与检索引擎中的多个第一文本块的向量化结果进行相似度对比,得到综合相似度得分最高的第一预设数量的第一文本块;针对第一预设数量的第一文本块,检索与每个第一文本块对应的第二文本块,得到多个第二文本块;基于每个向量化模型,将检索语料的向量化结果分别与检索引擎中的多个第二文本块的向量化结果进行相似度对比,得到最终排序结果。本申请实施例使用多阶段检索和排序,能够提升检索准确率和短文匹配长文准确率。
技术关键词
文本检索方法
语义
多模型
子模块
文本检索系统
切割模块
多阶段