摘要
本发明涉及自然语言处理领域,提供一种分层级联的嵌套实体识别模型及其构建方法、存储介质,该方法包括:根据预设的实体类别和嵌套层级数对样本语句进行分层实体标注;将样本语句的分层实体标注结果按照BIESO标注模式分别对每一实体层进行序列标注;将序列标注结果作为样本输入数据输入ERNIE3.0预训练模型进行预训练,获得与样本语句对应的动态词向量;采用外层实体识别模型对所述动态词向量进行学习训练,获得样本语句中的外层实体,并从中识别出嵌套有内层实体的外层实体;根据外层实体所属实体类别将外层实体输入到与所属实体类别对应的内层实体识别模型进行学习训练,获得外层实体中第二层实体。本发明大大提高了嵌套实体识别的准确性和效率。
技术关键词
实体识别模型
语句
CRF模型
嵌套
样本
词语
动态
分层
自然语言
语义
识别模块
识别误差
级联
实体识别方法
序列
工具包
分析模块
模式
组织
系统为您推荐了相关专利信息
蛋白
线性变换矩阵
成分分析
计算机可执行指令
标签
肿瘤分子诊断技术
代谢组学分析技术
体外诊断标志物
磷酸盐缓冲液
十八烷基硅烷键合硅胶
深度神经网络模型
监督学习模型
逆向设计方法
合金
训练深度神经网络