摘要
本发明公开了一种大语言模型多级检索增强方法,具体涉及多级检索技术领域,通过对用户输入的查询进行初始解析和生成核心查询语句以及初级检索文档集,更准确地理解用户的查询意图,对初级检索文档集进行聚类分析并识别出冗余风险文档集、保留文档集以及信息缺失风险文档集,获取冗余风险文档集的冗余检测信息和可信度评估信息,对冗余风险文档集进行初次筛选,有效过滤冗余且可信度较低的检索文档,根据信息缺失风险文档集生成补充查询语句在知识库中进行二次检索,更全面地覆盖用户的多角度需求和潜在的模糊意图,通过文档质量系数和文档新鲜度系数的综合计算,生成文档优先级推荐指数,确保质量高且时效性强的文档优先展示给用户,提升用户体验。
技术关键词
冗余
大语言模型
新鲜度
语句
内容更新
风险
表达式
生成文档
核心
查询主题
标记
时间差
词语
指数
查询意图
分词
检索技术
主题模型
逻辑
因子