摘要
本发明公开了一种基于W2ner模型的文化知识图谱构建方法,属于文化、人工智能技术领域,包括S1:数据采集;S2:基于W2ner模型对采集的数据进行复杂实体识别;S3:基于大语言模型进行开放域关系抽取;S4:利用K‑means聚类算法实现关系短语的有效合并,进行关系规范化;S5:将经过识别、抽取及对齐后得到的规范化知识三元组存入数据库中,并进行可视化输出;本发明整合了针对复杂实体识别、开放域关系抽取、关系规范化的专门技术模块,并结合图数据库存储,形成更适应文化文本特性、自动化程度更高的知识图谱构建技术方案。
技术关键词
知识图谱构建方法
多层感知机
关系
实体
字符
知识图谱构建技术
大语言模型
三元组
统计年鉴
样本
预训练模型
人工智能技术
交互特征
文本
网格
三步法
格式
算法
参数
数据
系统为您推荐了相关专利信息
网络拓扑
特征提取网络
分类方法
计算机设备
聚类
关系抽取方法
知识图谱向量
协同注意力
三元组
文本编码器