摘要
本发明公开了一种基于强化学习的动态层次化多智能体控制方法,首先根据需求确定层次结构的层级数量,将智能体划分为若干子群体,并在每个子群体中选出负责进行通信的代表,根据确定的强化学习算法,构建动态层次化多智能体策略优化模型,并基于奖励函数对动态层次化多智能体策略优化模型进行训练,并利用训练后的动态层次化多智能体策略优化模型生成多智能体控制方案,并根据环境变化进行信息交互与策略更新,实现多智能体的动态调整。本发明的方案动态的调整智能体层次,并根据层级进行分层级的策略生成和融合,在确保系统协同决策和学习效果的同时,减少了通信负载,降低了网络带宽需求,提高了系统的可扩展性和稳健性。
技术关键词
多智能体控制方法
策略优化模型
强化学习算法
网络
代表
动态
计算机可存储介质
多层次策略
层级
策略更新
处理器
聚类算法
计算机设备
存储器
坐标
参数
决策
系统为您推荐了相关专利信息
优化BP神经网络
缺陷定量表征
管线钢管道
脉冲涡流检测信号
仿真数据
序列预测模型
指令
马尔可夫模型
计算机
异常检测方法
缓冲区溢出漏洞
矩阵
检测缓冲区溢出
神经网络模型
Word2Vec模型
输电线路监测系统
告警抑制方法
热力图
深度学习网络
时序