基于K均值聚类的数据识别方法、系统、设备及存储介质

正文

推荐专利

申请号：CN202410961615

申请日期：2024-07-18

公开号：CN118503768B

公开日期：2024-11-05

类型：发明专利

摘要

本发明提供了一种基于K均值聚类的数据识别方法、系统、设备及存储介质，包括：对输入的数据集进行清洗和标准化处理，获得预处理数据；通过遗传算法确定K均值聚类的初始中心；对预处理数据执行K均值聚类，并且执行聚类期间动态调整聚类数目K，获得聚类结果；利用内部评价指标、外部评价指标以及相对评价指标对聚类结果进行评估，去除未达标的聚类结果后，获得待处理聚类结果；基于待处理聚类结果，识别并标记出对深度学习模型训练质量影响最大的数据点，数据点位于聚类中心或密集区域；将识别出的数据点组成训练数据集，供深度学习模型训练使用。利用先进的聚类算法和自动化处理技术，显著提高了处理大数据集的效率和数据识别的精度。

技术关键词

数据识别方法深度学习模型训练指标染色体表达式遗传算法函数式数据可视化工具数据识别系统数据分布异常数据初始聚类中心构建决策树统计学方法机器学习算法轮廓系数密度标签

系统为您推荐了相关专利信息

一种基于融合模型的齿轮钢淬透性预测方法

淬透性预测方法齿轮钢 XGBoost模型物理机器学习模型

一种低碳零排放工厂化循环水养殖系统

低碳零排放工厂化循环水养殖系统调控模型管理服务器可执行程序代码数据

基于改进resnet网络的复数网络SAR识别方法

识别方法网络协方差矩阵融合特征深度学习特征

存储集群下共享卡的故障恢复方法及装置

故障检测模型故障恢复方法检测数据输入通道指标

一种基于VMD-SSA-BiLSTM的水电机组振动趋势预测方法

趋势预测方法水电机组 BiLSTM模型搜索算法传感器监测

基于K均值聚类的数据识别方法、系统、设备及存储介质

站点导航

APP 下载