摘要
本发明公开了一种基于级联框架的水利数值上下文信息抽取方法,由模型编码器对输入水利领域文本开展预处理操作,以此获取语义表示;可同步启动数值标记器与单位和修饰词提取器;其中,数值标记器负责对输入水利领域文本加以分析,以识别其中潜在的数值;单位和修饰词提取器则用于识别数值对应的单位和修饰词;对象及关系标记器在数值标记器完成工作之后介入,对象标记器利用序列标注方法,识别出数值有关的实体、属性等上下文信息,关系标记器通过基于双向问答的跨度预测系统,确定对象之间的关系分类。本发明通过级联多个关键部件来实现数值上下文信息的精准抽取,为水利领域信息化建设提供新的方法。
技术关键词
信息抽取方法
数值
标记器
水利
级联
分类器
标签模式
预测系统
规则方法
对象
框架
文本段落
字符
序列标注方法
条件随机场模型
语义特征
实体
预定义关系
系统为您推荐了相关专利信息
路网拓扑结构
安置方法
水动力学模型
风险
基础地理数据
管材内高压成形
BP神经网络
工艺优化方法
遗传算法
染色体
LightGBM模型
产品推荐方法
档位
渠道
标识