摘要
本发明公开了一种基于表示学习的自适应知识构建方法、系统、设备及存储介质,所述知识构建方法包括:采集涵盖不同领域、不同类型的数据,对采集的数据进行预处理,形成资源库;通过经训练的长短期记忆网络模型,对资源库中的数据进行表示学习,得到数据的低维向量表示;基于数据的低维向量表示,通过自然语言处理方法将资源库中数据的知识以结构化的形式提取出来,对提取出的知识进行筛选与优化,基于聚类算法对筛选与优化后的知识数据进行整合归类;对整合归类的知识数据进行存储、管理与更新。本发明不依赖于标注数据,能够对复杂多源异构进行高效的知识构建,同时具有对动态变化数据的自适应能力。
技术关键词
知识构建方法
资源库
长短期记忆网络
命名实体识别模型
自然语言
聚类算法
关联规则挖掘算法
词语
动态变化数据
数据挖掘算法
初始聚类中心
双曲正切函数
计算机
可读存储介质
文本
数据采集模块