摘要
本发明提供了一种强化学习驱动的不均衡数据分类任务优化方法,主要为了解决当少数类样本本身较少或分布复杂时,合成的样本可能不完全准确反映真实分布以及关键信息丢失的问题,本发明的方案设计对抗场景并引入强化学习模型辅助训练,能显著提高分类精度和模型的泛化能力;强化学习模型负责选择适当的训练样本,并基于分类器的预测结果调整参数;同时,分类器模型接收这些样本进行预测,并根据预测结果进行自身模型的更新。本发明所提出的算法在不均衡cifar‑10数据集中具有优秀的分类精度,显著优于同类的算法,并且不局限于任何特定的模型类型,从而提供了极高的灵活性和可扩展性,具备强大的应用潜力。
技术关键词
强化学习模型
均衡数据分类
分类器模型
更新分类器
样本
构建分类器
参数
贪婪策略
标签
序列
通道
原始图像数据
DQN算法
图像特征提取
随机梯度下降
分类准确率
可读存储介质
采取行动
训练集
系统为您推荐了相关专利信息
作业无人机
工业设备智能
调度系统
数据
可执行程序代码
电子病历信息
预警模型
交叉韧带重建
膝关节
预警方法
水上船坞
换电系统
卡尔曼滤波融合
障碍物
强化学习模型
酱香型白酒
地理标志产品
图像特征提取模型
深度学习识别模型
样本