摘要
本申请涉及知识图谱领域,公开了一种企业地址数据处理及预测的方法和系统,该方法包括通过清洗多源异构地址数据构建知识库并训练嵌入增强模型,采用Word‑Pi ece算法和领域扩展词典进行多粒度分词,将结果输入模型生成初始层级标签序列,经地名识别模型校验补全后,基于优先级融合规则输出标准化结构化地址;该系统包括数据清洗与知识库构建模块,层级预测模型训练模块,多粒度分词模块,层级预测模块,层级校验与融合模块,分布式计算集群。本发明通过融合语义与地理特征提升解析准确性,结合动态知识库适应行政区划变更;采用分布式计算与加速技术优化处理效率;通过自动化校验减少人工干预,并生成标准化地址数据。
技术关键词
地名识别
层级
分词
实体
分布式计算集群
异构
预测模型训练
标签
企业
数据
融合语义
序列
多层感知机
并行计算单元
词典
训练语料库
模块
LSTM模型
移除噪声
系统为您推荐了相关专利信息
智能机
实体
障碍物
机器人导航技术
关键词提取模型
识别方法
数据获取设备
数据分析模块
特征值
数据处理模块