摘要
本发明公开了一种基于级联框架的水利数值上下文信息抽取方法,由模型编码器对输入水利领域文本开展预处理操作,以此获取语义表示;可同步启动数值标记器与单位和修饰词提取器;其中,数值标记器负责对输入水利领域文本加以分析,以识别其中潜在的数值;单位和修饰词提取器则用于识别数值对应的单位和修饰词;对象及关系标记器在数值标记器完成工作之后介入,对象标记器利用序列标注方法,识别出数值有关的实体、属性等上下文信息,关系标记器通过基于双向问答的跨度预测系统,确定对象之间的关系分类。本发明通过级联多个关键部件来实现数值上下文信息的精准抽取,为水利领域信息化建设提供新的方法。
技术关键词
信息抽取方法
数值
标记器
水利
级联
分类器
标签模式
预测系统
规则方法
对象
框架
文本段落
字符
序列标注方法
条件随机场模型
语义特征
实体
预定义关系
系统为您推荐了相关专利信息
资源配置方法
软件维护工作
专业
软件失效模式
信息系统软件
避雷器在线监测
三相母线
避雷器运行状态
傅里叶变换算法
相对湿度