摘要
本发明提供一种基于自适应样本扩充的PM2.5污染预测方法及设备,该方法包括:S1:获取目标预测区域不同时刻的PM2.5浓度数据及环境数据集构成初始样本数据集;S2:预处理环境数据集,提取与PM2.5浓度相关特征,进行筛选后得到相关特征集合;S3:以相关特征集合为约束,计算样本相似度构建矩阵,聚类得到样本类别与数量;S4:将初始样本数据集切分输入对抗网络训练,生成对抗网络模型;S5:依样本类别数量,使用模型生成新样本;S6:扩充样本集后训练机器学习模型得到PM2.5浓度预测模型。本发明能够生成高质量的PM2.5数据扩充样本,改善训练样本数据分布平衡性,提升PM2.5污染预测的准确性和可靠性。
技术关键词
污染预测方法
生成对抗网络模型
训练机器学习模型
生成样本数据
污染物特征
随机噪声
气象
氧化剂
表达式
数据分布
输出特征
微处理器
高斯核函数
高浓度
矩阵
传播算法
相对湿度