摘要
本发明属于数据挖掘技术领域,涉及一种覆盖负利润的海量数据相关高效用项集挖掘方法。该方法包括:数据库多级分区初始化;候选项生成与排序;构建预评估矩阵;对满足效用约束的候选项构建其效用列表;分区迭代处理;深度优先搜索与项集拓展;递归终止与结果输出。本发明首次提出支持覆盖负利润的相关高效用项集挖掘的算法框架,完整覆盖实际商业场景中的高效用项集。通过重构效用上界与相关性剪枝机制,实现大规模数据的高效计算。
技术关键词
高效用项集挖掘方法
剪枝策略
深度优先搜索
利润
分区方法
列表
数据挖掘技术
索引机制
矩阵
算法框架
指标
定义
度量
重构
商业
标记