摘要
本发明公开一种基于最大池化提取片段边界和相邻片段间隙特征的命名实体识别方法,该方法将文本中字符间的两两关系定义为实体边界关系、实体片段边界关系、片段间隙关系和无关系四种类型,采用二维矩阵进行表示,其中上三角矩阵编码实体片段边界关系和片段间隙关系,下三角矩阵编码实体边界关系,通过最大化算子生成字符之间关系的特征表示,并利用卷积神经网络进行特征表示学习,得到字符间两两关系的特征表示矩阵。本文通过计算关系标签特征表示和字符间两两关系特征表示的相似度,为字符间关系匹配关系标签,通过字符间关系解码得到文中的平坦命名实体、不连续命名实体、重叠命名实体和长命名实体。本发明方法解决了之前统一命名实体识别模型中基于流水线方法的任务间错误传播问题和基于相邻字符关系方法的局部误差传播问题。
技术关键词
间隙特征
字符
命名实体识别方法
预训练语言模型
关系
空洞卷积神经网络
标签特征
矩阵
识别神经网络
边界特征
空洞尺寸
文本
命名实体识别模型
识别命名实体
流水线方法
编码
处理器