摘要
本发明提供一种基于知识点扩充的领域知识库构建方法及装置,所述方法包括根据初始query集合中的每个种子query进行搜索,生成初始知识点数据;基于自定义的二分类模型,对所述初始知识点数据进行分类,滤除与拟构建领域知识库所在的专业领域不相关的知识点数据;根据所述有效知识点数据和自定义的知识库构建收敛条件,确定知识库构建结果,当所述构建结果为继续构建时,基于所述有效知识点数据对所述初始query集合进行扩展和聚类,生成更新后的query集合,并令更新后的query集合为初始query集合后进行重复迭代。所述方法和装置通过采用query搜索和扩充聚类,知识点数据分类模型以及与搜索引擎资源相结合的方式,提高了知识库的覆盖率和更新效率。
技术关键词
知识点
种子
知识库构建方法
语义向量
二分类模型
网页解析技术
专业
数据分类模型
输出模块
数据存储
生成网页
矩阵
基础
聚类
页面
电子设备
分块
处理器