摘要
本发明公开了一种电力营销知识图谱构建方法、系统、设备及存储介质,涉及电力系统数据治理技术领域。目前,多源异构数据的整合与应用困难,数据异常检测、治理效率低,数据流转不稳定。本发明包括步骤:收集多个源的数据,进行数据清洗和标准化处理;将数据按照结构化、半结构化、非结构化进行分类,并通过特征提取方法形成特征向量;使用自然语言处理和机器学习技术从特征向量中提取知识单位,并通过规则或模型对不同来源的知识进行融合,构建统一知识库;利用知识库生成图数据库中的知识图谱,构建节点和边的图结构;对知识图谱中的数据流转进行实时监控,分析路径效率。本技术方案提高数据治理效率,并实时监控数据流转,优化业务流程。
技术关键词
面向多源异构数据
知识图谱构建方法
逻辑回归模型
自然语言
知识图谱构建系统
机器学习技术
电力
异常数据检测
实体
节点间信息
构建知识图谱
数据分类
分词技术
定义
遍历算法
特征提取模块
系统为您推荐了相关专利信息
文本分类模型
模型训练方法
文本分类方法
格式模板
文本分类装置