摘要
本发明实施例公开了一种运行日志的数据挖掘方法及装置、设备及存储介质,方法包括:获取服务器的运行日志对应的第一数据集,第一数据集包括若干待挖掘的样本数据;利用样本数据之间的第一距离、第一数据集的第一平均距离以及预设的临近样本的选取规则,确定各个用于反映样本数据对应的临近样本数据的第二数据集;根据第二数据集的数据密度以及第二平均距离,确定各个用于反映第二数据集的密度分布特征的目标参数;利用各个目标参数以及预设的中心选取规则进行聚类的初始中心点选取处理,确定初始中心点;基于初始中心点、预设的聚类算法以及第一数据集进行聚类处理,确定目标聚类结果。实现了无需进行枚举即可确定初始中心点,提高聚类效率。
技术关键词
样本
密度分布特征
数据挖掘方法
Canopy算法
服务器性能评估
数据挖掘装置
参数
处理器
清洗规则
噪声集
数据获取模块
聚类算法
计算机设备
可读存储介质
系统为您推荐了相关专利信息
功率模块
换流阀
工况参数
训练样本集
神经网络模型
情感分析方法
情感分析模型
错误特征
多模态特征
子模块