摘要
一种基于大语言模型的电力行业动态知识库构建方法和系统,涉及电数字数据处理领域,该方法包括:接收用户导入的电力领域文档,转换电力领域文档为电子文档;调用大语言模型解析电子文档,提取电子文档中的专业术语定义、图表位置信息和文档逻辑层次,生成包含多个上下文的知识单元;连接知识单元为有向知识链路,并计算有向知识链路中相邻的知识单元之间的语义相似度,对有向知识链路进行分段,得到多个知识主题;接收知识检索指令,确定知识检索指令对应的目标知识主题;提取目标知识主题中对应的目标知识单元,基于目标知识单元的目标上下文生成知识检索结果。实施本申请,能优化知识库构建,保证知识库数据的完整性。
技术关键词
数据处理系统
大语言模型
知识库构建方法
生成知识
链路
电力
计算机程序代码
主题
表格
多模态
训练样本集
电数字数据处理
电子
布局结构
计算机程序产品
预训练语言模型
图表
转移概率矩阵
指令