摘要
基于感知增强的非连续实体识别方法、设备及存储介质,属于自然语言处理技术领域,解决现有的非连续命名实体识别方法存在标注数据资源需求量大以及存在解码多义性的问题;本发明将非连续实体识别划分为实体检测和实体分类两部分,实体检测部分在编码器的嵌入层融合单词连续型提示感知嵌入,以保证预测得到的实体序列按文本序列中的先后顺序输出;实体分类部分基于实体检测部分得到的实体序列,提供额外提示知识,对文本序列进行实体信息补全,丰富非连续实体信息,降低了实体分类阶段难度,能够有效避免标注数据资源消耗过大和解码多义性等问题,提升低数据资源场景下的非连续实体识别准确率。
技术关键词
序列
文本
编码器
命名实体识别方法
解码器
字符
处理器
存储器
自然语言
连续型
语义
资源
线性
程序
数据
参数
系统为您推荐了相关专利信息
病灶分割方法
神经网络模型
图像编码
病理切片图像
切块
非结构化文本
报告
标识符
构建数据仓库
语义向量
电缆性能检测方法
映射误差
故障特征
能量聚集
序列