摘要
本申请涉及一种基于文本片段表征学习的地名识别方法、装置及设备。所述方法包括:构建了一个地名识别模型,该模型将地名识别任务定义为文本片段分类任务,目的在于识别输入文本中的每个文本片段是否属于地名实体这一类型。一方面,该模型通过地名检索器检索多样化的外部地名实体,将检索到的地名实体知识与输入文本拼接,以构造新的提示输入;另一方面,该模型利用基于语言模型的提示编码器对该提示输入进行编码,并通过专用的文本片段表征单元获得更精确的文本片段的语义表示,以及通过文本片段分类器对每个文本片段进行地名识别。采用本方法能够通过精确的文本片段表示和外部地名实体知识的有效融合来提升地名识别的准确度。
技术关键词
文本
实体
地名识别方法
语义
编码器
分类器
前馈神经网络
识别器
模板
训练集
预训练语言模型
索引
模型训练模块
定义
交互特征
计算机设备
查找表
超参数