摘要
本发明提供了一种基于K均值聚类的数据识别方法、系统、设备及存储介质,包括:对输入的数据集进行清洗和标准化处理,获得预处理数据;通过遗传算法确定K均值聚类的初始中心;对预处理数据执行K均值聚类,并且执行聚类期间动态调整聚类数目K,获得聚类结果;利用内部评价指标、外部评价指标以及相对评价指标对聚类结果进行评估,去除未达标的聚类结果后,获得待处理聚类结果;基于待处理聚类结果,识别并标记出对深度学习模型训练质量影响最大的数据点,数据点位于聚类中心或密集区域;将识别出的数据点组成训练数据集,供深度学习模型训练使用。利用先进的聚类算法和自动化处理技术,显著提高了处理大数据集的效率和数据识别的精度。
技术关键词
数据识别方法
深度学习模型训练
指标
染色体
表达式
遗传算法
函数式
数据可视化工具
数据识别系统
数据分布
异常数据
初始聚类中心
构建决策树
统计学方法
机器学习算法
轮廓系数
密度
标签
系统为您推荐了相关专利信息
淬透性预测方法
齿轮钢
XGBoost模型
物理
机器学习模型
低碳零排放工厂化循环水养殖系统
调控模型
管理服务器
可执行程序代码
数据
识别方法
网络
协方差矩阵
融合特征
深度学习特征
故障检测模型
故障恢复方法
检测数据输入
通道
指标
趋势预测方法
水电机组
BiLSTM模型
搜索算法
传感器监测