摘要
本发明提供一种基于知识图谱的检索增强函件文本分析方法及系统。该方法包括:获取样本函件文本进行预处理,并构建向量数据库;将向量文本块进行实体关系识别,并以三元组形式构建函件知识图谱,通过函件知识图谱索引对向量数据库中的向量文本块进行唯一ID标识,建立向量文本块与函件知识图谱的关联;获取用户提问信息,分别在向量数据库、函件知识图谱检索,将检索结果融合获得混合检索信息;将混合检索信息作为大模型的提示词与用户提问信息一同输入到大语言模型中,输出用户提问信息对应的回答文本信息。本发明按照知识图谱索引给每个文本块向量分配ID建立了知识图谱数据库和向量数据库之间的关联,在进行混合检索时,大大减轻了工作量。
技术关键词
文本分析方法
三元组
实体
水印
文本分析系统
知识图谱数据库
标识
多头注意力机制
样本
计算机终端
索引
分块
混合模块
处理器
关系
输出模块
序列
可读存储介质
系统为您推荐了相关专利信息
特征联合学习
位置识别方法
描述符
排序损失
分层特征
三元组
图谱
实体间关系
计算机可读代码
模型训练方法
知识问答系统
图谱
子模块
命名实体识别
微调单元