一种基于强化学习的动态层次化多智能体控制方法

正文

推荐专利

申请号：CN202411875323

申请日期：2024-12-19

公开号：CN119337962B

公开日期：2025-03-11

类型：发明专利

摘要

本发明公开了一种基于强化学习的动态层次化多智能体控制方法，首先根据需求确定层次结构的层级数量，将智能体划分为若干子群体，并在每个子群体中选出负责进行通信的代表，根据确定的强化学习算法，构建动态层次化多智能体策略优化模型，并基于奖励函数对动态层次化多智能体策略优化模型进行训练，并利用训练后的动态层次化多智能体策略优化模型生成多智能体控制方案，并根据环境变化进行信息交互与策略更新，实现多智能体的动态调整。本发明的方案动态的调整智能体层次，并根据层级进行分层级的策略生成和融合，在确保系统协同决策和学习效果的同时，减少了通信负载，降低了网络带宽需求，提高了系统的可扩展性和稳健性。

技术关键词

多智能体控制方法策略优化模型强化学习算法网络代表动态计算机可存储介质多层次策略层级策略更新处理器聚类算法计算机设备存储器坐标参数决策

系统为您推荐了相关专利信息

基于改进小龙虾优化算法优化BP神经网络的X80管线钢缺陷定量表征方法

优化BP神经网络缺陷定量表征管线钢管道脉冲涡流检测信号仿真数据

用户行为异常检测方法、电子设备和存储介质

序列预测模型指令马尔可夫模型计算机异常检测方法

基于双特征比对的人脸识别方法、装置、设备、存储介质

识别人脸图像人脸识别方法关键点坐标样本

一种针对FreeRTOS缓冲区溢出漏洞的图神经网络检测方法

缓冲区溢出漏洞矩阵检测缓冲区溢出神经网络模型 Word2Vec模型

一种基于时序样本分析的输电线路监测系统通用重复告警抑制方法

输电线路监测系统告警抑制方法热力图深度学习网络时序

一种基于强化学习的动态层次化多智能体控制方法

站点导航

APP 下载