摘要
本发明属于信息处理技术领域,提供了一种融合别名库和文本相似度的烟草实体链接方法及系统,包括:获取烟草实体的相关文本;将相关文本中识别得到的烟草实体作为键,在预设的烟草实体别名库中匹配相应的键值对;如果匹配成功,键值对中的值则是该实体的链接对象;如果匹配不成功,将识别得到的烟草实体,与烟草实体别名库中所有实体进行文本相似度计算,根据计算的相似度确定链接对象,通过别名库与文本相似度两种方式确定链接对象的方式,有效降低了烟草实体简称和别称带来的链接难度,提高了实体链接的准确率。
技术关键词
实体链接方法
命名实体识别模型
文本
键值
实体链接系统
对象
词语
计算机程序产品
信息处理技术
编辑
处理器
数据采集模块
字符
可读存储介质
存储器
电子设备
列表