摘要
本发明涉及智能检索技术领域,特别是涉及一种工程知识库构建与深度检索方法,包括:在知识库构建阶段,通过对工程知识文档进行知识层次识别,形成以章节标题及对应内容为节点的多层次树状结构;对各节点的异构内容进行解析处理以生成知识片段;采用路径嵌入与内容嵌入相结合的方式生成知识片段的嵌入向量,并存储知识间关联关系、向量数据及原始信息,完成知识库构建。在深度检索阶段,当接收到用户问题后,通过查询重写生成知识空白问题清单,遍历清单检索知识库,经知识分组、相关性排序及循环终止判断优化检索过程,最终基于循环累积的已有知识生成并输出经可溯回验证的回复内容。本发明能够提升工程知识的复用效率与检索精准度。
技术关键词
节点
生成知识
树状结构
语义相关度
多层次
大语言模型
分布式对象存储系统
检索方法
启发式规则
算术平均值
智能检索技术
合并单元格
文本
层级
关系型数据库
表格
异构
图像