摘要
本发明属于地质文本信息处理技术领域,公开了一种地质知识约束的文本信息抽取方法及系统,该方法通过获取与处理地质文本资料,定义地质本体模型;按照地质本体模型对句子进行标注,得到地质实体关系数据集;构建基于跨度的地质命名实体识别模型,利用地质实体关系数据集对模型进行训练;利用地质本体模型进行地质实体对生成;利用关系抽取模型进行关系预测,实现输入文本的地质信息抽取。本发明通过地质本体模型过滤冗余的实体对,从而减少不必要的计算量、提升处理速度,显著提高关系识别的准确性。本发明将潜在的关系信息引入至模型输入,优化实体关系的提取精度,充分发挥地质领域知识的价值,实现高效的自动化信息抽取。
技术关键词
文本信息抽取方法
命名实体识别模型
实体关系数据
关系抽取模型
跨度
预训练语言模型
文本信息处理技术
前馈神经网络
信息抽取系统
资料
编码模块
定义
字符
语义