基于Apache Spark的石化数据大模型分析管理方法

正文

推荐专利

申请号：CN202410874167

申请日期：2024-07-02

公开号：CN118410361B

公开日期：2024-10-25

类型：发明专利

摘要

本发明公开了基于Apache Spark的石化数据大模型分析管理方法，涉及数据管理技术领域，通过欧式距离算法计算每个特征数据点与初始聚类中心的欧式距离，基于欧式距离远近生成多个聚类中心，当生成的聚类中心数量等于最优聚类数量时，完成聚类中心的选择步骤，在聚类簇初始划分完成后，Spark的迭代计算功能用于不断更新聚类簇的聚类中心；这一过程继续，直到聚类中心的变动稳定，此时使用Spark输出最终的聚类结果；所有聚类簇的聚类中心不再发生变化后，输出聚类结果；该管理系统不需要预先标记的训练数据，更加灵活和适用于石化行业中未标记数据的分析和管理，有效提高管理系统适应性以及对数据的处理效率。

技术关键词

分析管理方法初始聚类中心轮廓系数销售额管理策略管理系统 k均值聚类算法数据管理技术企业可视化工具点分配标记表达式逻辑

系统为您推荐了相关专利信息

基于模糊逻辑控制的面向仿蝠鲼潜水器的多源能源系统

潜水器太阳能光伏电池板俘能装置模糊逻辑控制模块摩擦发电装置

电力设备的运行策略确定方法及装置

温度预测模型历史风速数据历史温度数据残差模块时间序列模型

一种基于大数据的电网负荷管理方法及系统

电网负荷管理系统跨行业数据大数据知识图谱构建社交媒体平台

基于智能驾驶的网络信息安全访问控制方法

信息安全访问控制方法访问控制策略车辆地理位置车载网络交互特征

基于数字孪生驱动的信贷策略智能优化方法及装置

数字孪生体数字孪生驱动风险智能优化方法信用评估模型

基于Apache Spark的石化数据大模型分析管理方法

站点导航

APP 下载