摘要
本发明公开了一种基于异质多智能体强化学习算法的异构设备控制方法,该方法针对多智能体系统中的设备异质性问题,通过将异构设备协同控制问题建模为异质多智能体强化学习问题,利用中心化训练分布式执行框架,得到最优异质多智能体策略网络,实现对异质设备的高效控制。本发明能够处理不同类型设备的协同控制,提高算法的适应性和收敛性,具有良好的鲁棒性和扩展性,适用于不同规模和复杂度的多智能体系统。
技术关键词
多智能体强化学习
异构设备
异质
策略
参数
网络
算法
多智能体系统
裁剪方法
动态
框架
鲁棒性
指标
场景
复杂度
阶段
定义
数据
规模