摘要
本发明公开了一种多智能体强化学习系统,包括本地协调控制子系统和全局协调控制子系统;本地协调控制子系统包括生物启发行为模块、集群行为控制模块和本地智能体策略池,生物启发行为模块用于实现智能体的避障、导航和智能体内多个操作的协调控制,集群行为控制模块用于实现智能体的集群行为控制,本地智能体策略池用于存储智能体处理策略;全局协调控制子系统包括全局数据更新模块、全局仲裁模块和全局智能体策略池,全局数据更新模块用于向全局内的智能体推送全局策略并获取智能体累积的策略,全局仲裁模块用于确定最佳策略,全局智能体策略池用于存储所述最佳策略。上述方案给出了仿生智能强化学习框架,能够提高系统的学习率和性能。
技术关键词
强化学习系统
多智能体强化学习
策略
子系统
数据更新
控制模块
集群
强化学习框架
强化学习算法
生成动作
生物
速度
决策
无人机
运动
地面
系统为您推荐了相关专利信息
反演方法
轨道
K均值聚类算法
监视系统
自动化算法
车辆纵向运动
轨迹预测模型
车辆动力学模型
节点
动态
缓存配置方法
数据访问
容器
序列二次规划算法
序列规划方法