摘要
本发明提供了一种基于语义理解的电力标准知识图谱构建方法,包括以下步骤:获取电力标准文档,通过OCR识别非结构化文本,将电力标准文档解析为XML或JSON格式,并基于Bi‑LSTM+CRF模型对文本进行章节、条款、术语和表格的语义切分;通过低资源知识抽取框架提取标准术语、设备参数和标准条款,基于N‑gram entity mean方法计算术语、设备和参数的语义向量;通过LPG模型构建标准‑设备‑参数‑用户关联网络,并通过TransE/TransH模型进行设备适配推理。本发明通过采用OCR识别结合深度学习模型Bi‑LSTM+CRF和低资源知识抽取框架,对电力标准文档进行解析,有效提高标准术语、设备参数等信息的提取精度。
技术关键词
知识图谱构建方法
术语
非结构化文本
语义向量
CRF模型
电力
度计算方法
参数
计算机可读指令
知识图谱构建系统
总线系统
翻转算法
表格
格式
存储器
上传方式
处理器
可读存储介质
系统为您推荐了相关专利信息
偏好特征
个性化内容推荐
注意力机制
sigmoid函数
兴趣