摘要
本申请提供了一种面向用户定位的地理词向量构建方法,属于自然语言处理技术领域,具体包括将地理实体以及和地理实体相关联的文本语料作为数据来源,构建地理语料库;将地理语料库输入至BERT模型进行训练,获得地理语料库中每一个地理词语的地理词向量,地理词向量中包含了地理词语在句子中的上下文信息;基于地理词向量对Bi LSTM‑CRF模型进行训练,利用训练后的Bi LSTM‑CRF模型进行地名识别与提取。通过本申请的处理方案,提高了地理信息提取的准确率。
技术关键词
词向量构建方法
CRF模型
地理实体
地名识别
地理信息提取
词语
文本
网络爬虫技术
BERT模型
阶段
自然语言
数据
指标
标记
美食
话题
分词
序列
关系
参数