摘要
本发明提供了一种知识结构抽取和知识库构建方法及系统,包括:步骤S1:基于包括数据库、上传的文件以及互联网采集多源数据,并对采集的多源数据进行预处理;步骤S2:基于预处理后的多源数据分别进行满足预设要求的关键信息抽取处理;步骤S3:基于抽取的关键信息进行多粒度的切割与合并处理,形成文本语料;步骤S4:基于文本语料利用大语言模型进行文本中的实体、属性和关系抽取处理,从而形成知识库。本发明通过利用大规模预训练语言模型进行知识结构抽取和知识库构建,实现了高效、准确的知识抽取和分类,能有效服务于不同的业务场景。
技术关键词
知识库构建方法
大语言模型
语义检索方式
文本
数据
标签体系
预训练模型
关系网络
构建系统
预训练语言模型
实体
中间件
互联网
模板
模块
编码器
序列
语句
系统为您推荐了相关专利信息
数字孪生驱动
联邦学习方法
智能电网系统
分布式数据库
数字孪生模型