摘要
本发明涉及机器学习与数据挖掘技术领域,具体涉及一种面向不平衡数据的多智能体强化学习分类方法,首先,引入马尔可夫决策过程构建基于多智能体强化学习的分类模型,其中每个智能体通过观察样本状态并给出相应的分类结果,环境则根据分类结果向智能体提供反馈,以此强化智能体对不平衡样本的学习;其次,针对多数类样本与少数类样本分别设定不同的奖励,并使用双重深度神经网络计算累积奖励,通过优先经验回放优化训练过程,提升对少数类的学习;最后,将智能体中心化训练与去中心化执行结合分布式计算,优化智能体交互与学习效率。经与现有的不平衡数据分类方法相比较,本发明可以有效提高对少数类的分类准确性,并缩短多智能体协作分类时间。
技术关键词
学习分类方法
样本
深度神经网络训练
多智能体强化学习
多智能体协作
数据分类方法
智能体交互
数据挖掘技术
时序
决策
参数
表达式
误差
文本
在线
标签
因子
系统为您推荐了相关专利信息
卷积特征提取
空间金字塔池化
裂纹识别
多层级特征
金字塔网络
灰阶
函数关系模型
亮度
计算机指令执行
尺寸显示面板
胎儿心率
信号生成方法
信号生成系统
融合特征
局部特征提取