摘要
本发明公开了种面向多维度数据集的指标异常归因方法,包括:步骤一、当某业务指标较对比期发生异常时,读取所有维度交叉下当期与对比期的明细指标值作为输入数据;步骤二、计算每个维度的基尼系数,进行维度预剪枝,剪除维值数量占比和影响力极端的维度,参考叶子节点的波动方向将所有叶子节点分类。本发明,当数据量和维度数过多时,在不影响准确性的前提下利用灵活的剪枝策略极大缩小了搜索空间;综合考虑了贡献度以及根因的传播效应,突破了当前算法的假设条件局限性,能够适配绝大多数场景,提高归因方法的适用范围;通过严格的因果验证,可将误归因率降低,能够建立因果关联而非仅依赖相关性,从而显著提升归因结论的可信度。
技术关键词
归因
搜索规则
节点
信息熵
指标
异常数据
算法
剪枝策略
索引
场景
关系