摘要
本发明公开了基于Apache Spark的石化数据大模型分析管理方法,涉及数据管理技术领域,通过欧式距离算法计算每个特征数据点与初始聚类中心的欧式距离,基于欧式距离远近生成多个聚类中心,当生成的聚类中心数量等于最优聚类数量时,完成聚类中心的选择步骤,在聚类簇初始划分完成后,Spark的迭代计算功能用于不断更新聚类簇的聚类中心;这一过程继续,直到聚类中心的变动稳定,此时使用Spark输出最终的聚类结果;所有聚类簇的聚类中心不再发生变化后,输出聚类结果;该管理系统不需要预先标记的训练数据,更加灵活和适用于石化行业中未标记数据的分析和管理,有效提高管理系统适应性以及对数据的处理效率。
技术关键词
分析管理方法
初始聚类中心
轮廓系数
销售额
管理策略
管理系统
k均值聚类算法
数据管理技术
企业
可视化工具
点分配
标记
表达式
逻辑
系统为您推荐了相关专利信息
潜水器
太阳能光伏电池板
俘能装置
模糊逻辑控制模块
摩擦发电装置
温度预测模型
历史风速数据
历史温度数据
残差模块
时间序列模型
电网负荷管理系统
跨行业数据
大数据
知识图谱构建
社交媒体平台
信息安全访问控制方法
访问控制策略
车辆地理位置
车载网络
交互特征
数字孪生体
数字孪生驱动
风险
智能优化方法
信用评估模型