摘要
本发明公开了一种文档检索方法、装置、电子设备、存储介质及产品。方法包括:获取用户输入的检索问题;基于预设BM25算法确定待检索文档集合中每个文档分别与检索问题的原始相似度评分;根据各文档的文档长度和预设归一化参数确定第一归一化因子;第一归一化因子用于消除文档长度对原始相似度评分的影响;根据第一归一化因子对原始相似度评分进行归一化处理,得到第一相似度评分;基于各文档对应的第一相似度评分生成目标检索结果。采用本发明的文档检索方法,能够消除检索文档长度差异对传统BM25算法输出的相似度评分的影响,实现给定检索问题内的检索结果相似度评分的可比性,从而提高检索结果的准确性和可靠性。
技术关键词
文档检索方法
因子
检索算法
文档检索装置
计算机程序产品
电子设备
参数
可读存储介质
统计特征
处理器通信
模块
存储器
指令
线性
数据