摘要
本申请提供了一种面向工业过程运维的多阶段渐进式增强知识检索方法,涉及自然语言处理与信息检索领域,方法包括:构建工业过程运维领域的知识库;获取用户查询并进行分类;通过分类后的用户查询以及BM25算法,对知识库中的文档进行筛选,确定第一候选文档;通过TF‑IDF词频‑逆文档频率和余弦相似度相结合的轻量过滤方法,对第一候选文档进行筛选,得到第二候选文档;通过基于密集向量的检索,对第二候选文档进行精确排序,得到与用户查询最匹配的答案,本发明通过查询路由、关键词召回、轻量过滤和向量精排四个阶段的检索策略,逐层优化检索过程,从而提高了检索效率和检索精度。
技术关键词
知识检索方法
工业设备数据
过滤方法
运维
阶段
网络接口
BERT模型
频率
检索策略
答案
可读存储介质
信息检索
算法
设备通信
电子设备
存储器
计算机
自然语言
指令