摘要
本申请公开了一种卷烟制丝加工领域的知识抽取方法及装置,方法包括:将卷烟制丝加工领域的待抽取文本输入实体抽取模型中;基于实体抽取结果对待抽取文本进行依存句法分析;基于依存分析结果组成三元组结构;其中,对实体抽取模型进行训练包括:从卷烟制丝加工领域的数据中划分出非结构化知识文本;依据卷烟制丝数据特点构建本体网络结构;基于本体网络结构对非结构化知识文本进行标注,形成数据集;其中每个实体的标注包括起止位置和实体类型;基于数据集对实体抽取模型进行训练。本申请依据卷烟制丝数据特点构建本体网络结构,辅助实体抽取模型清晰地划分实体边界,有助于提高实体抽取的准确度。
技术关键词
卷烟制丝
实体
知识抽取方法
依存句法分析
文本
抽取装置
网络结构
三元组
条件随机场模型
数据
分析模块
自然语言
词典
分词
图谱
关系
专业
系统为您推荐了相关专利信息
向量特征提取
能力知识图谱
语义向量
专业特征
输出模块
知识图谱模型
知识图谱推理
排放特征
数据处理方法
数据分析算法