摘要
本发明公开一种基于序列交互和句法集成的中文命名实体识别方法。采用检索算法,基于输入序列检索相关上下文序列,并使用中文自然语言处理工具包得到输入序列的三种句法信息,句法成分、词性标签和依存关系;将输入序列、上下文序列以及三种句法信息分别输入命名实体识别模型,获得融合输入序列和上下文序列的序列交互信息,以及融合句法成分、词性标签和依存关系的句法集成信息,最后动态地将两种信息融合输入条件随机场,得到输入序列的命名实体标签序列。通过融合序列交互信息和句法集成信息,不仅有效补充了句子级输入序列缺失的实体信息,还引入了模型中关于句子的文本结构信息,并灵活调整了两种信息的重要性,从而达到更高的识别性能。
技术关键词
句法信息
中文命名实体识别方法
序列
上下文特征
字符
文本
融合特征
预训练语言模型
标签
命名实体识别模型
工具包
条件随机场
交叉注意力机制
检索算法
中文自然语言
集成模块
编码
系统为您推荐了相关专利信息
强化学习模型
融合深度学习
深度学习模型
调参方法
RNN模型
图像序列数据
油管
状态识别方法
钻具
边缘检测算法
状态预测方法
长短记忆神经网络
飞行状态数据
卷积神经网络提取
数据处理单元
气体泄露检测方法
多元传感器
环境传感器
注意力
数据