摘要
本发明涉及机器学习数据预处理技术领域,具体为一种保持特征比例关系的机器学习采样方法及系统,本发明通过划分类别子集并约束采样后的特征均值向量与原始数据一致,确保特征与目标变量的比例关系不被扭曲,避免模型误判特征重要性。再通过验证协方差矩阵的一致性,维持了特征间的相关性结构,提升了依赖统计特性的模型的泛化能力。在解决样本不平衡问题的同时,严格保持了原始数据集中特征与目标变量的比例关系,以及特征间的比例关系,从而提升了机器学习模型训练的准确性与可靠性。
技术关键词
采样方法
样本
采样系统
关系
特征协方差矩阵
机器学习模型训练
数据预处理技术
数据处理模块
表格式数据
策略
变量
参数
偏差
系统为您推荐了相关专利信息
多头注意力机制
模态特征
情感分析方法
金字塔
情感分析模型
电磁优化方法
多项式
信赖域算法
微波滤波器技术
测试误差
样本分类方法
推荐算法
特征提取器
重构算法
矩阵
模型训练方法
样本
计算机可执行指令
编码向量
网络