摘要
本发明属于资源勘查、地质填图和环境监测技术领域,公开一种基于深度学习的地学表格数据增强方法、装置及系统和存储介质,其中方法通过将数据集中的连续特征向量作为条件输入,保留其物理属性和多尺度关联性;并构建基于随机森林、SVM和XGBoost的分类投票器,实现离散特征的预测与补全,有效应对小样本离散标签不足的问题。为系统评估模型性能,还构建了多维度评价体系。以多组岩芯分析数据为例的实验结果表明,与目前最优的CTGAN模型相比,ICG‑GAN生成的数据分布更接近原始数据,在六项应用指标上均实现显著性能提升。
技术关键词
连续特征数据
分类器
标签
正态分布曲线
表格
分布直方图
样本
随机噪声
环境监测技术
模型训练模块
离散特征
存储计算机程序
投票器
数据分布
分布特征
随机森林
指标
可读存储介质
岩芯
系统为您推荐了相关专利信息
气体泄漏检测方法
门控循环单元网络
多频段
雷达
特征提取网络
传感器
景观
信号
特征点
非易失性计算机可读存储介质
标签天线
电子标签芯片
柔性抗金属标签
天线主体
频段
汽车驾驶员疲劳驾驶
驾驶员面部
中控主机
疲劳驾驶状态
视频采集模块