摘要
本发明提供一种基于地质报告文本数据的矿产地信息人工智能提取方法,包括下述步骤:S1、矿产地数据模型构建;S2、文本数据准备,包括全文数据库构建和报告文本筛选;S3、领域字典的构建,包括地质专业词典、地名词典、矿产地专业词典以及关系词典的构建;S4、标注规范的制定;对地质报告文本进行大规模标注时,首先设定标注规范,以避免标注结果的随机性及杂乱性;S5、标注过程,包括样本的人工标注,标注结果的评价;实体及关系标注;S6、矿产地信息输出。本发明结合了人工智能技术,能够快速、高效、准确地从矿产地领域地质报告文本中挖掘提取出矿产地信息,既能提高矿产地信息利用水平,又能节省矿产地信息提取和处理的人力成本。
技术关键词
地名词典
文本
报告
关系抽取模型
实体识别模型
专业
CRF模型
矿石品位
关键字
LSTM模型
三元组
资料
人工智能技术
字典
数据项