摘要
本发明涉及知识图谱技术领域,具体为基于无监督学习知识图谱构建方法及系统,所述方法包括:获取文本数据,对收集的文本数据进行预处理,并对文本数据进行分词,得到文本数据的分词结果;基于预训练语言模型,对文本数据的分词结果进行实体识别,并对文本数据中的实体识别结果进行歧义消除;采用无监督模型抽取实体关系,生成实体和实体关系三元组;构建实体关系权重计算公式,并将实体关系权重映射为实体关系置信度,过滤置信度值低于阈值的实体关系;基于文本数据中抽取的实体和实体关系,构建文本数据的知识图谱。本发明提高了知识图谱构建的效率和质量,为智能搜索、问答、推荐等知识驱动的应用提供了重要的知识支撑。
技术关键词
知识图谱构建方法
无监督学习
文本
抽取实体关系
三元组
分词
数据
预训练语言模型
无监督模型
实体关系抽取模型
词典
词语
依存句法分析
实体识别模型
知识图谱技术
维特比算法
系统为您推荐了相关专利信息
样本
情感分类模型
预训练语言模型
扰动技术
情感分类器
机器学习模型
性能分析方法
液流电池
分块
电池荷电状态