摘要
本发明提供了一种基于信息熵测度的数据价值评估方法即系统,方法包括获取待评估的数据集,对各数据集建立概率模型,根据所确定的模型复杂度和数据量的大小,选择参数估计方法,使用估计得到的模型参数估计这些数据点发生的概率;对于各数据集,使用信息量函数计算数据集的信息熵;通过计算得到的信息熵,对整个数据集的平均信息量或不确定性进行价值评估,得到各数据集的价值。本发明的方法不直接依赖于数据的具体内容,而是依赖于数据的整体分布和概率特性,因而能有效地解决数据复杂性高的问题,同时识别和过滤掉冗余信息。
技术关键词
数据价值评估方法
正态分布模型
信息熵
参数估计方法
伽马分布模型
马尔可夫模型
泊松分布模型
矩估计方法
EM算法
计算机可读取存储介质
复杂度
贝叶斯信息准则
价值评估系统
排序算法
分布特征
样本
数据获取单元
处理器
系统为您推荐了相关专利信息
分布式存储节点
分布式存储服务器
分布式存储管理
分片
生成结构化数据
综合能源系统
优化调度模型
优化调度方法
负荷
功率
知识图谱构建方法
多模态
跨模态数据
特征提取方法
语义