摘要
基于感知增强的非连续实体识别方法、设备及存储介质,属于自然语言处理技术领域,解决现有的非连续命名实体识别方法存在标注数据资源需求量大以及存在解码多义性的问题;本发明将非连续实体识别划分为实体检测和实体分类两部分,实体检测部分在编码器的嵌入层融合单词连续型提示感知嵌入,以保证预测得到的实体序列按文本序列中的先后顺序输出;实体分类部分基于实体检测部分得到的实体序列,提供额外提示知识,对文本序列进行实体信息补全,丰富非连续实体信息,降低了实体分类阶段难度,能够有效避免标注数据资源消耗过大和解码多义性等问题,提升低数据资源场景下的非连续实体识别准确率。
技术关键词
序列
文本
编码器
命名实体识别方法
解码器
字符
处理器
存储器
自然语言
连续型
语义
资源
线性
程序
数据
参数
系统为您推荐了相关专利信息
资产评估方法
高维特征向量
多模态
传输方法
数据编码器
分布式网络系统
可用性监测系统
节点
推送告警信息
系统日志