摘要
本公开涉及自然语言处理技术领域,公开了命名实体识别方法、装置及产品,该方法包括:获取待识别的文本序列;提取文本序列的嵌入向量,嵌入向量包括词嵌入向量、字符嵌入向量、词汇嵌入向量和句法嵌入向量;融合词嵌入向量、字符嵌入向量和词汇嵌入向量,得到第一融合向量,并提取第一融合向量的全局特征张量和局部特征张量;对句法嵌入向量进行特征增强,得到深层语法特征向量;基于全局特征张量、局部特征张量和深层语法特征向量,生成文本序列的命名实体识别结果。本公开融合了全局特征张量和局部特征张量,能够有效地利用文本的上下文信息,并且加入了深层语法特征向量,能够增强对语法结构的理解,从而提高命名实体的识别精度。
技术关键词
命名实体识别方法
编码向量
词嵌入向量
序列
文本
双向长短期记忆网络
条件随机场
状态空间模型
命名实体识别装置
语法特征
注意力
字符
融合特征
标签
前馈神经网络
矩阵
非线性
语法结构
计算机程序产品