摘要
本发明公开了一种基于进化课程学习的多智能体强化学习方法和系统,涉及多智能体决策技术领域。该方法包括以下步骤:在每个课程学习阶段,首先对智能体进行多种群的并行训练,以生成每种角色的多智能体初始种群;随后,对初始种群执行进化种群选择过程,以筛选出最优种群用于下一课程学习的训练,重复该步骤直到达到设定的智能体数量,结束该训练过程。该方法有效解决了传统课程学习中知识迁移适应性差的问题,提高了传统课程学习的性能。此外,在最优种群选择过程中,通过对种群进化过程的合理简化,实现了算法训练效率与性能的平衡。
技术关键词
智能体强化学习方法
阶段
多层感知机
强化学习系统
编码向量
巡逻无人机
网络
注意力
机器人
策略
障碍物
数据
决策
指数
因子
算法
参数
系统为您推荐了相关专利信息
医学图像分割模型
医学图像分割方法
解码器
前馈神经网络
梯度下降优化算法
电池容量计算方法
充放电曲线
空间分布特征
时空注意力机制
电解液