基于文本片段表征学习的地名识别方法、装置及设备

正文

推荐专利

申请号：CN202510456075

申请日期：2025-04-11

公开号：CN119988568B

公开日期：2025-07-18

类型：发明专利

摘要

本申请涉及一种基于文本片段表征学习的地名识别方法、装置及设备。所述方法包括：构建了一个地名识别模型，该模型将地名识别任务定义为文本片段分类任务，目的在于识别输入文本中的每个文本片段是否属于地名实体这一类型。一方面，该模型通过地名检索器检索多样化的外部地名实体，将检索到的地名实体知识与输入文本拼接，以构造新的提示输入；另一方面，该模型利用基于语言模型的提示编码器对该提示输入进行编码，并通过专用的文本片段表征单元获得更精确的文本片段的语义表示，以及通过文本片段分类器对每个文本片段进行地名识别。采用本方法能够通过精确的文本片段表示和外部地名实体知识的有效融合来提升地名识别的准确度。

技术关键词

文本实体地名识别方法语义编码器分类器前馈神经网络识别器模板训练集预训练语言模型索引模型训练模块定义交互特征计算机设备查找表超参数

基于文本片段表征学习的地名识别方法、装置及设备

站点导航

APP 下载