摘要
本发明公开了一种融合多源数据的企业实际经营所在地识别方法及系统,所述识别系统包括数据获取模块、NLP技术应用处理模块、知识图谱构建模块、数据融合与打分模块和结果输出模块,所述识别方法步骤包括多源数据采集、数据清洗、利用自然语言处理技术进行数据处理、构建地址信息知识图谱、数据融合与打分和结果输出,本发明通过对多源企业信息的处理,然后从多源信息中分别抽取、解析、标准化地址和发布时间,最后构建知识图谱,通过权重计算后进行地址坐标聚类,从而获取企业真实经营地址,能够帮助相关管理部门更准确、高效地识别企业的实际经营所在地,提升监管和服务水平,同时对企业的业务布局和管理也具有重要的指导意义。
技术关键词
融合多源数据
信息知识图谱
识别方法
企业
构建知识图谱
NLP技术
知识图谱构建
文本
地址标准化
实体
数据融合算法
识别系统
自然语言
输出模块
标准化方法
验证机制
数据获取模块
数据采集模块
地点