摘要
本发明涉及地质领域,尤其涉及一种基于改进原型网络的小样本地质关系抽取方法。该方法包括,获取地质实体及其三元组,并以此构建地质领域关系抽取数据集;以BERT‑base‑Chinese作为预训练模型,对数据集进行关系抽取,获取词嵌入,以捕捉词汇间的语义关系和上下文信息;利用预训练模型对数据集进行分词处理,来进一步训练模型;在模型中加入全局注意力机制,并基于全局注意力机制进行文本编码,在模型中加入关系描述,使用一个可学习的参数来动态调整句子信息和关系描述的权重;根据每次训练的结果,动态更新权重,使模型逐渐专注于更具挑战的任务。本发明大幅提高了地质领域关系抽取的准确率。
技术关键词
关系抽取方法
上下文特征
实体
原型
预训练模型
注意力机制
样本
动态更新
网络
词嵌入向量
三元组
分类准确率
计算机装置
计算机程序产品
处理器
数据
分词