摘要
本发明公开了一种基于非均衡测井数据的煤体结构识别方法,包括以下步骤:首先获取煤层中不同煤体结构的常规测井数据并对其进行异常值剔除和标准化处理;采用k‑means对每种煤体结构的测井数据进行聚类分析,使用轮廓系数优选出最优聚类数;根据聚类结果,通过ADASYN对不均衡测井数据重采样,使得每种煤体结构的数据量均匀分布;利用KS检验和信息熵综合评估均衡化处理后样本数据的效果;构建随机森林模型识别煤体结构并对模型的性能进行评价。结果表明,使用上述方法处理的非均衡测井数据,在随机森林算法识别煤体结构时准确率较高。
技术关键词
煤体结构
结构识别方法
样本
测井曲线
数据
轮廓系数
初始聚类中心
信息熵
概率密度函数
经验分布函数
随机森林模型
模型超参数
核密度估计法
随机抽样方法
网格
分布特征