摘要
本发明属于自然语言处理与知识图谱技术领域,提供了一种基于知识图谱的实体网络构建方法和系统。包括:利用自动化脚本和命名实体识别技术,从设定数量开源数据集中抽取特定领域的实体信息;从专业数据库中抽取特定领域的实体及其之间的关系信息;根据实体名称、实体及其之间的关系信息对抽取的实体名称进行预处理和模糊匹配,以识别出相同的实体;根据相同的实体,构建包含实体和关系的初步领域实体网络;使用知识图谱协同预训练语言模型对初步领域实体网络进行关系补全和优化,形成目标领域实体网络。本发明降低了数据处理的复杂性、解决了跨领域实体匹配困难的问题、提升了匹配准确度、增强了知识图谱中未知关系的补全能力。
技术关键词
网络构建方法
命名实体识别技术
预训练语言模型
专业数据库
网络构建系统
自然语言技术
脚本
网络模块
知识图谱技术
实体间关系
编辑
文本
动态更新
系统为您推荐了相关专利信息
语义
文本
预训练语言模型
依存句法分析
BiLSTM模型
文本特征向量
填补方法
数据
时序
深度学习模型训练
词语
文档分类方法
训练主题模型
预训练语言模型
语义