摘要
本发明涉及油气人工智能与数据管理领域,公开了一种基于三元组关联的油气地质知识图谱构建方法、系统、介质及设备,其包括:采用大语言模型对油气地质文本进行实体抽取,从油气地质文本中识别并提取实体;通过语义相似度算法,将抽取识别出的实体与权威文献进行关联,以得到每个实体的来源;结合专业词典与教材,对每个抽取识别出的实体分配相应精确的术语定义,以实现术语定义整合;将抽取识别的实体、实体的来源及实体的术语定义进行三元组构建,由抽取识别的实体、实体的来源及实体的术语定义构成“实体‑来源‑定义”的知识单元,进而构建油气地质领域的知识图谱。本发明有效提高了信息的准确性。
技术关键词
知识图谱构建方法
实体
油气
三元组
术语
大语言模型
文本分析技术
定义
知识图谱构建系统
词典
语义匹配方法
知识图谱推理
自然语言
专业
链接模块
算法
系统为您推荐了相关专利信息
电力设备
问答系统优化方法
节点
路径优化策略
分布式传感器网络