摘要
本发明公开了基于自编码器和回归模型辅助GAN表格数据生成方法,具体涉及数据生成与建模技术领域;是通过自编码器对原始输入变量特征进行压缩重构,以提取潜在表示结构;并结合多种机器学习模型对输出变量进行拟合预测,通过交叉验证筛选出性能最优的回归模型,实现输入变量与输出变量之间关联关系的精确建模。构建生成对抗网络模型以真实数据为指导,融合自编码器的重构能力和回归模型的预测能力,优化生成器生成的虚拟表格数据质量,从而提升生成数据在语义结构、变量分布与预测有效性方面的准确性。适用于具有输入输出字段特征的结构化场景,实现小样本条件下高质量合成数据生成。
技术关键词
机器学习模型
数据生成方法
编码器
表格
冗余特征
变量
支持向量回归模型
生成对抗网络模型
重构误差
结构化场景
预测误差
交叉验证方法
梯度提升机
线性回归模型
随机森林模型
决策树模型
语义结构
多层感知机