摘要
本申请实施例提供一种基于PLC专利数据的知识图谱构建方法、装置、设备及介质,通过对多个专利数据库的结构化专利数据和非结构化专利数据分别进行标准化处理,得到初始标准化专利数据并进行跨数据源语义映射与统一编码处理,得到带有全局实体标识的标准化专利数据集;基于实体识别模型对标准化专利数据集中的文本数据进行实体标注、消歧与对齐处理;根据标准化专利数据集和实体识别模型的处理结果,生成结构化知识实体库;根据结构化知识实体库,构建文本数据中每个文本句子对应的依存句法树;基于每个文本句子的中心词和对应的依存句法树,确定目标实体三元组;根据所有依存句法树对应的目标实体三元组,构建PLC专利数据知识图谱。
技术关键词
依存句法树
实体识别模型
实体依存关系
数据
三元组
知识图谱构建方法
句法结构
分词
知识图谱构建装置
双向长短期记忆网络
条件随机场模型
自然语言识别
文本识别
术语
标签
模块
计算机程序产品
系统为您推荐了相关专利信息
水闸结构
监测系统
成像模块
数字信号处理单元
三维有限元模型
语句
对话生成方法
语义特征
三元组
对话生成系统
图像隐私保护方法
同态加密算法
解密
对称加密算法
医疗信息系统