摘要
本发明一种基于词性标注的细粒度信息抽取方法与系统,所述方法包括:预先存储的典型例句的编码和信息抽取策略;将待分析的语句进行短语级别的分词并对短语进行词性标注;对邻接的短语按照编码策略进行合并、隐藏;根据S标注出的词性和句子结构,将句子中的标记为名词、动词和动词短语用词性进行替换,形成待分析语句的编码;将待分析语句的编码与预先存储的典型例句的编码进行匹配;若与预先存储的典型例句匹配上,则按照已匹配到的典型例句的抽取策略对待分析句子进行信息抽取;若没有匹配上,则按照信息抽取策略对待分析句子进行信息抽取;并将此待分析语句的编码与信息抽取策略进行存储。本发明的信息抽取流程可以快速适应新的信息抽取需求。
技术关键词
信息抽取方法
动作关系
实体
语句
编码策略
代表
三元组
典型
分词
人机交互界面
编辑界面
模式匹配
模块
符号
关键词
标记
系统为您推荐了相关专利信息
智能匹配系统
特征提取系统
贸易
命名实体识别模型
编码
工业互联网平台
接口管理方法
复杂度
语义标签
程序