摘要
本发明提供了一种数据质量评估方法及系统,涉及数据质量评估技术领域,其中,本发明提供的一种数据质量评估方法,用于知识图谱构建的耦合型数据质量评估,其具体包括如下步骤:获取知识图谱的实体历史版本集合及其属性时序数据,计算每个实体的冗余度指标和时效性熵变指标,基于耦合系数计算耦合质量指数;构建全局质量评估矩阵;根据全局质量评估矩阵的奇异值的分布特征输出质量评估结果及清洗策略。本发明的方法显著地提升了知识图谱数据质量评估的准确性、适应性和可操作性,为构建和维护高质量、低冗余、高时效的知识图谱提供了有效的技术手段。
技术关键词
实体
清洗策略
评估系统
冗余度
时效性
知识图谱构建
信息熵
指标
矩阵
邻域
知识图谱数据
分布特征
处理器
生成规则
生成方式
指数
分解器
系统为您推荐了相关专利信息
面向关系型数据库
生成方法
语义结构
字段
动态校正