摘要
本发明公开了一种基于文本资料的知识语义树构建方法,属于自然语言处理技术领域。本发明基于专业领域的相关文本资料,在预处理的基础上,通过文本挖掘提取特征信息,对相关词汇进行词袋建模和聚类分析,不断填充相关属性,并拓展各实体之间的联系,逐步构建语义树,形成计算机可识别的先验知识。本发明通过构建知识语义树,提供一种直观的知识体系表示方式,便于将不同类型的知识的进行集成与融合,支持信息检索、智能问答、语义分析等知识服务应用任务,支持高效推理,使其在数据的标准化方面更容易推广、相应的工具更便于统一。
技术关键词
树构建方法
文本
资料
词袋模型
构建语义树
语义角色标注
语句
直方图
剔除噪声
矩阵
数据
投影方法
聚类方法
树状结构
信息检索
专业
词语
自然语言
系统为您推荐了相关专利信息
事件抽取技术
知识图谱构建方法
出土文物
文本
数据管理系统
SOC芯片
图像处理系统
总线电路
视频数据传输
脉冲宽度调制接口