摘要
本发明涉及语言检索增强技术领域,公开了一种骨干光通信设备文档检索优化方法及系统,方法包括:基于设备文档获取命名实体类型以及关系类型,构建数据结构;基于数据结构,通过大语言模型抽取命名实体和关系词生成至少两个三元组数据;对生成的所有三元组数据进行去重与融合,得到多元组数据,以形成完整的知识图谱;构建文本向量数据库;响应于查询命令,抽取查询命令中的命名实体以及关键词,得到命令实体和命令关键词,并将查询命令转化为嵌入向量;对命令实体、命令关键词和嵌入向量进行混合检索与相似度匹配,获取相应匹配结果并进行去重、融合与重排,得到优化结果,最终生成查询答案,从而提高查询效率和准确率,降低维护成本。
技术关键词
光通信设备
命令
多元组
关键词
文本
实体
三元组
计算机可执行指令
图谱
大语言模型
关系
构建数据结构
数据存储
答案
模块
合并算法
近似算法
分块
系统为您推荐了相关专利信息
BERT模型
画像方法
企业画像
画像系统
多标签