一种面向中文短文本内的地名识别方法

正文

推荐专利

一种面向中文短文本内的地名识别方法

申请号：CN202411907282

申请日期：2024-12-24

公开号：CN119337884A

公开日期：2025-01-21

类型：发明专利

摘要

本发明提供了一种面向中文短文本内的地名识别方法，涉及自然语言处理领域，包括：基于OSM地图、GeoNames数据库和高德地图设计多个地名数据存储表，并对每个地名数据存储表进行中文地名提取获得多源全球中文地名词典；获取并预处理外文社交媒体的文本数据，基于所述多源全球中文地名词典对预处理后的文本数据的地名进行匹配获得地名候选词集合；以地名候选词嵌入的多源文本信息嵌入、Cross‑Transformer Encoder的文本信息融合编码和融合信息动态筛选与解码为组成单元构建集成神经网络模型；将预处理后的文本数据和地名候选词集合输入至所述集成神经网络模型中对文本数据的真实地名进行识别获取识别结果。

技术关键词

地名识别方法面向中文地名词典文本残差归一化集成神经网络字符高德地图地理实体地名数据库数据存储多头注意力机制编码融合语义格式化前馈神经网络社交

系统为您推荐了相关专利信息

基于联盟链和大语言模型的煤矿调度语音信息存储

信息处理模块数据加密分布式账本存储模块语音

一种指向性手势和语言指令驱动的目标导航方法及其系统

人体关键点手势导航方法自然语言终点

一种基于事件权威影响力计算的流聚类故事生成方法

故事生成方法社交媒体数据挖掘话题模型文本算法

一种基于句法信息增强的细粒度隐喻识别方法

句法信息词语识别方法线性分类器独立语义

一种基于邻域聚合与图自注意力的储能电池失效预测方法

失效预测方法储能电池节点实体邻域

一种面向中文短文本内的地名识别方法

站点导航

APP 下载