一种应用于不平衡数据的自适应集成学习分类方法

AITNT
正文
推荐专利
一种应用于不平衡数据的自适应集成学习分类方法
申请号:CN202411551532
申请日期:2024-11-01
公开号:CN119202949A
公开日期:2024-12-27
类型:发明专利
摘要
本发明提出一种应用于不平衡数据的自适应集成学习分类方法,包括以下步骤:对原始数据进行预处理并提取负类数据和正类数据;然后分别划分为训练集、验证集和测试集;利用滑动窗口对正类和负类的训练集提取特征;对其中的负类聚类后对样本随机欠采样;将欠采样后的样本和相同特征子集下的正类训练集样本组合;选择随机森林为基分类器并利用组合的训练集进行训练;利用正类和负类的验证集组合计算基分类器的交叉熵损失并为每一个基分类器分配权重;利用正类和负类测试集组合进行加权投票,得到预测标签以进行指标计算。本发明结合特征子集的多样性提取和聚类欠采样技术,在面对不平衡数据集的分类问题时能提高对少数类样本的识别能力,优化分类性能。
技术关键词
集成学习分类方法 滑动窗口 训练集 数据 标签 样本 随机森林 分类器训练 采样技术 索引 特征数 指标 两阶段 算法 基础 格式 策略 标记
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号