一种基于考古文献资料的知识图谱构建方法、系统及介质

正文

推荐专利

申请号：CN202410940712

申请日期：2024-07-15

公开号：CN118917312A

公开日期：2024-11-08

类型：发明专利

摘要

本发明涉及自然语言处理技术领域，公开了一种基于考古文献资料的知识图谱构建方法、系统及介质，包括：采集考古发掘文献资料，并进行数据清洗和预处理，得到考古文本；根据考古的信息特征，设定分词工具，基于分词工具对考古文本进行分句和分词，得到词向量文本；基于BILSTM对词向量文本进行特征提取，得到单词特征序列；基于CRF对单词特征序列进行标注，并识别单词特征序列中的目标实体；基于实体关系抽取模型抽取目标实体之间的关系，得到实体关系三元组；对实体关系三元组进行消歧，构建面向考古领域的知识图谱。本发明实现了考古资料中的独特文本特征和关系的有效处理，提高了考古学中的关键实体识别的准确性和辨别力。

技术关键词

知识图谱构建方法循环神经网络模型实体关系抽取模型文本序列条件随机场模型分词三元组标注策略知识图谱构建系统标注工具生成知识图谱标签实体消歧定义训练集矩阵估计方法

系统为您推荐了相关专利信息

药物推荐方法、装置、电子设备及存储介质

药物推荐方法文本数据画像聚类

基于参数融合与解耦的大语言模型模态扩展方法及装置

大语言模型多模态参数计算机可读取存储介质预训练语言模型

图像语义分割方法、装置、电子设备和可读介质

令牌语义分割网络图像语义分割方法融合特征掩膜

一种基于样本熵的建筑能耗评价与调度方法

能耗样本序列建筑设备 PID控制算法

一种基于大语言模型的数据分析方法及系统

大语言模型数据分析方法多任务数据分析系统人力资源数据

一种基于考古文献资料的知识图谱构建方法、系统及介质

站点导航

APP 下载