摘要
本申请提供一种基于文档嵌入的查询匹配方法,应用于查询匹配系统,该系统包括多个目标文档,方法包括:在离线阶段:对每个目标文档,将其进行切分得到多个文本块;确定目标文档的预测查询问题和文档标题;生成各文本块、预测查询问题和文档标题各自对应的向量;根据上述向量生成各文本块对应的目标向量;在查询阶段:接收用户查询,计算对应的查询向量;对每个目标文档,分别计算查询向量与该目标文档对应的多个目标向量的相似度,并根据其中的最大相似度确定用户查询的查询结果。由此,通过为目标文档生成预测查询问题以及标题,可以扩展目标文档的语义表达类型,以实现更有效的相似度计算,从而提高查询匹配效果。
技术关键词
文本
查询匹配方法
计算机存储介质
阶段
离线
大语言模型
存储器
输出模块
语义
程序
处理器
指令
动态