摘要
本发明涉及数据分类技术领域,具体涉及一种用于智慧共享体系建设的数据智能共享方法。该方法利用每个条件属性对总历史业务数据进行分裂得到不同子数据集,根据总历史业务数据与每个条件属性的子数据集中指标属性的指标特征的混乱程度的差异,以及每个条件属性与关注属性的历史业务数据的变化趋势的相似程度,获取每个条件属性的初始优先指标,并结合每个条件属性对关注属性的影响程度和每个条件属性与其他条件属性的相关程度调整初始优先指标,从而构建决策树,将总历史业务数据进行分类与共享。本发明结合条件属性在分割数据集时带来的信息增益、重要程度与不同条件属性的相关程度构建决策树,提高决策树基于关注属性进行分类的效果。
技术关键词
智能共享方法
指标
构建决策树
信息熵
序列
数据分类技术
误差函数
皮尔逊相关系数
收入
数值
线性
算法
元素