摘要
本发明公开了一种大规模稀土数据信息提取方法,涉及稀土研究技术领域,该大规模稀土数据信息提取方法,包括稀土产品生产方法专利命名实体识别数据集的构建,针对目前在稀土产品生产方法专利领域数据集缺乏的现状,对稀土产品生产方法专利领域数据集的相关概述,对稀土产品生产方法专利文本的内容进行分析,对稀土产品生产方法专利数据集进行了实体类别的划分,且详细介绍了各个类别的情况,对稀土产品生产方法专利数据集的实体进行标注工作的介绍,包括了实体类别标签的定义,使用工具对实体类别的标注,导出json数据文件,使用脚本程序对json数据文件进行BIOES的转换。
技术关键词
数据信息提取方法
时间序列特征
稀土
命名实体识别
文本
CRF模型
多头注意力机制
参数
CNN网络结构
摘要
预训练模型
动态
算法模型
标签
自然语言