摘要
本申请公开了一种命名实体识别方法、装置、设备及存储介质,涉及自然语言处理技术领域,该方法包括:通过目标领域对应的提示信息获取目标领域的初始实体本体,并基于初始实体本体创建实体本体数据集;获取待识别异构文档对应的文本格式文档,并提取文本格式文档中的目标子词;通过预设词相似度算法基于目标子词从实体本体数据集中确定目标已知实体;通过预设掩码命名实体识别方式基于目标已知实体对文本格式文档进行命名实体识别,获得实体识别结果。应用上述技术方案,解决了现有技术中的命名实体识别方法对标注数据的依赖性高,无法在标注数据稀缺的场景中高效应用的技术问题。
技术关键词
命名实体识别方法
便携式文档
命名实体识别装置
异构
格式
数据
分词算法
自然语言
处理器
识别模块
可读存储介质
存储器
计算机
噪声
标记
系统为您推荐了相关专利信息
多层混压电路板
鲁棒策略
多任务损失函数
引入注意力机制
多层板叠层结构
通信链路控制方法
异构网络融合
Mesh自组网
链路冗余备份
信号干扰比
无人机数据
监测方法
数字地表模型
随机森林模型
二维图像数据