摘要
本发明公开了一种融合辅助标注与依存分析的化工过程知识抽取方法,属于自然语言处理技术领域;所述方法包括:采集化工过程的生产资料和运维资料作为原始语料;对原始语料中部分数据进行处理和标注,包括数据集分割、关键词获取、关键词标注、数据集标注和数据集格式转换得到带标签的数据集;带标签的数据集与原始数据输入知识抽取模型中进行初步的知识抽取,包括BiLSTM‑CRF模型训练,利用训练好的模型进行命名实体识别,利用依存句法分析方法进行关系抽取;对初始结果进行融合,完成知识抽取任务;抽取到的知识以三元组的格式存储在图数据库中,便于工作人员查询和学习,以减少进行运维工作对专家的依赖,提高运维效率,降低人员培训成本。
技术关键词
知识抽取方法
化工
依存句法分析方法
关系
三元组
文本
命名实体识别
数据
核心
带标签
列表
序列
格式
汉字
训练集
关键词
双向长短期记忆
CRF模型