摘要
本发明涉及自然语言处理技术领域,公开了一种基于考古文献资料的知识图谱构建方法、系统及介质,包括:采集考古发掘文献资料,并进行数据清洗和预处理,得到考古文本;根据考古的信息特征,设定分词工具,基于分词工具对考古文本进行分句和分词,得到词向量文本;基于BILSTM对词向量文本进行特征提取,得到单词特征序列;基于CRF对单词特征序列进行标注,并识别单词特征序列中的目标实体;基于实体关系抽取模型抽取目标实体之间的关系,得到实体关系三元组;对实体关系三元组进行消歧,构建面向考古领域的知识图谱。本发明实现了考古资料中的独特文本特征和关系的有效处理,提高了考古学中的关键实体识别的准确性和辨别力。
技术关键词
知识图谱构建方法
循环神经网络模型
实体关系抽取模型
文本
序列
条件随机场模型
分词
三元组
标注策略
知识图谱构建系统
标注工具
生成知识图谱
标签
实体消歧
定义
训练集
矩阵
估计方法
系统为您推荐了相关专利信息
大语言模型
多模态
参数
计算机可读取存储介质
预训练语言模型
令牌
语义分割网络
图像语义分割方法
融合特征
掩膜
大语言模型
数据分析方法
多任务
数据分析系统
人力资源数据