摘要
本发明涉及基于多元组数据优化的大规模数据挖掘方法。首先通过设计基于信息增益和互信息的特征评估机制,对多元组数据中的各个维度特征进行重要性分析和排序;在特征选择与抽取后的数据集上,应用改进的聚类算法,结合密度聚类和层次聚类的优势,在高维多元组数据中识别结构的簇;基于聚类分析得到的聚类簇,通过设计跨维度的关联规则挖掘算法,在多元组数据中揭示跨维度关联关系;构建融合多元回归与深度学习技术的混合预测模型;利用多元组数据中的多维信息及已挖掘的关联规则,提升对目标变量的预测准确度。
技术关键词
大规模数据挖掘
多元组
数据分布
关联规则挖掘算法
动态特征选择
混合预测模型
模型训练算法
在线学习算法
滑动窗口技术
密度聚类算法
识别结构
深度学习技术
邻域搜索策略
分布式计算框架
梯度提升模型
集成学习方法
机制
系统为您推荐了相关专利信息
标签传播方法
神经网络特征
节点特征
消息传递机制
矩阵
人脸特征向量
人脸识别网络
识别方法
编码向量
粒子
理赔方法
数据分布
电子设备
可读存储介质
人工智能技术
性能指标预测方法
迁移学习模型
联邦模型
预测装置
工业