摘要
本申请实施例公开了一种基于知识图谱的结构化数据分类方法及装置,可以提高对公共领域构化库表数据的分类准确性。本申请实施例方法包括:获取公共领域核心词汇库;利用分词模型对所述公共领域核心词汇库进行实体信息抽取,得到多个实体和所述多个实体之间的关系信息;根据所述多个实体和所述关系信息构建知识图谱;将待分类数据输入所述分词模型,得到第一分词结果,所述待分类数据为结构化数据库表中的数据;将所述第一分词结果输入所述知识图谱,得到主题词类别;根据所述主题词类别确定分类模型;将所述第一分词结果输入所述分类模型,得到分类结果。
技术关键词
分词模型
构建知识图谱
实体
数据分类装置
分类器
输入输出单元
主题
BERT模型
注意力机制
关系
LDA模型
核心
切片
模块
可读存储介质
计算机
存储器