摘要
本发明涉及数据处理技术领域,尤其涉及知识图谱构建方法、装置、设备及存储介质,所述方法包括:获取工业领域通用知识图谱以构建训练数据集,基于训练数据集训练切块模型;将获取的待构建私有数据输入至所述切块模型中,得到文本块;获取示例数据,将文本块以及示例数据输入至预构建的大语言模型中,得到图数据;基于图数据生成加权图,对加权图进行图递归聚类处理,得到社区结构信息;采用图嵌入算法对社区结构信息进行处理,得到与待构建私有数据对应的知识图谱;本申请公开的方法,通过预训练切块模型,在面对各种类型的工业私有数据时,可提高切块灵活度和切块准确度,以平衡信息保真度和时间复杂度,大大提高了所生成的文本块的质量。
技术关键词
知识图谱构建方法
社区结构
数据
切块
注意力
编码器
位置编码技术
文本
解码器
元素
知识图谱构建装置
分块
聚类
算法
节点
摘要
工业
可读存储介质