摘要
本发明提供一种知识图谱生成方法、系统及终端设备,属于知识图谱生成技术领域,方法包括:上传目标文本数据,所述目标文本数据包括多个文本;该目标文本数据为预先收集的用于生成知识图谱的数据;对目标文本数据进行聚类,得到若干个类簇;从所得到的每一个类簇中分别抽取一个文本,得到一组目标文本;利用每一个目标文本构建GraphRAG提示词的任务样例,得到一组目标任务样例;将所得到的各目标任务样例提交给GraphRAG大语言模型;利用所述GraphRAG大语言模型,依据所述目标任务样例,提取所述目标文本数据中的实体与关系,生成知识图谱。本发明用于解决标注数据集少、数据质量参差不齐导致的知识图谱生成困难问题。
技术关键词
LDA主题模型
知识图谱生成方法
三元组
生成知识图谱
生成文本内容
实体关系提取
终端设备
分词
聚类
数据处理单元
生成技术
训练集
矩阵
系统为您推荐了相关专利信息
知识图谱补全方法
BERT模型
三元组
关系
实体