摘要
本申请提供一种数据混合探索的不确定性建模方法,包括:基于初步的数据聚类结果,分析数据项之间的潜在关系,计算不同特征之间的支持度和置信度,挖掘数据中的隐藏模式和关联规则,形成数据关联网络;根据数据关联网络,构建多层的神经网络模型,学习数据特征之间的非线性关系,得到能够表示数据内在结构的深度学习模型;利用深度学习模型对数据进行特征重要性评估,计算每个特征对建模任务的贡献度,根据贡献度大小对特征进行排序,选择贡献度最高的特征子集作为关键区域;对选定的关键区域进行自适应采样,包括根据数据分布特性动态调整采样密度,在重要区域增加采样点,在次要区域减少采样点,生成针对性的采样方案。
技术关键词
不确定性建模方法
深度学习模型
海量异构数据
采样点
数据标准化方法
聚类
数据分布
分布式计算框架
时间变化特征
主成分分析方法
皮尔逊相关系数
数据项
神经网络模型
初始化方法
概率密度函数
Apriori算法
交互网络
轮廓系数