摘要
本发明公开了一种CO2催化领域的多层次、广类别命名实体识别方法,其步骤包括:1)对关于CO2电催化还原的论文进行标注,得到一训练样本;2)生成训练样本的语义表示;3)将训练样本的语义表示输入实体识别模型,预测得到样本中每一实体的类型;根据预测结果和标注结果优化实体识别模型;4)根据设定的命名实体分类层级结构对各类型的实体进行细粒度标注,并将标注结果保存到数据字典中;5)对于一待处理论文,将该待处理论文的语义表示输入优化后的所述实体识别模型,预测得到该待处理论文中每一实体的类型;然后根据实体的类型在所述数据字典中查找匹配的细粒度类型,得到该待处理论文中每一实体的细粒度类型识别结果。
技术关键词
实体识别模型
命名实体识别方法
论文
语义
字典
双向长短期记忆
多层次
生成训练样本
BERT模型
条件随机场
投票方法
存储计算机程序
处理器
层级
数据
可读存储介质
存储器
摘要
服务器
系统为您推荐了相关专利信息
表征学习方法
图像重建
遥感影像数据
学生
编码器
稳定性分析方法
字典
均匀圆阵列天线
物体
信号获取模块
传输特征
多层感知网络
传输方法
性能指标数据
编解码
差分隐私
蒸馏方法
特征提取器
类别随机采样
图像