一种基于强化学习的动态层次化多智能体控制方法

AITNT
正文
推荐专利
一种基于强化学习的动态层次化多智能体控制方法
申请号:CN202411875323
申请日期:2024-12-19
公开号:CN119337962B
公开日期:2025-03-11
类型:发明专利
摘要
本发明公开了一种基于强化学习的动态层次化多智能体控制方法,首先根据需求确定层次结构的层级数量,将智能体划分为若干子群体,并在每个子群体中选出负责进行通信的代表,根据确定的强化学习算法,构建动态层次化多智能体策略优化模型,并基于奖励函数对动态层次化多智能体策略优化模型进行训练,并利用训练后的动态层次化多智能体策略优化模型生成多智能体控制方案,并根据环境变化进行信息交互与策略更新,实现多智能体的动态调整。本发明的方案动态的调整智能体层次,并根据层级进行分层级的策略生成和融合,在确保系统协同决策和学习效果的同时,减少了通信负载,降低了网络带宽需求,提高了系统的可扩展性和稳健性。
技术关键词
多智能体控制方法 策略优化模型 强化学习算法 网络 代表 动态 计算机可存储介质 多层次策略 层级 策略更新 处理器 聚类算法 计算机设备 存储器 坐标 参数 决策
系统为您推荐了相关专利信息
1
基于改进小龙虾优化算法优化BP神经网络的X80管线钢缺陷定量表征方法
优化BP神经网络 缺陷定量表征 管线钢管道 脉冲涡流检测信号 仿真数据
2
用户行为异常检测方法、电子设备和存储介质
序列预测模型 指令 马尔可夫模型 计算机 异常检测方法
3
基于双特征比对的人脸识别方法、装置、设备、存储介质
识别人脸图像 人脸识别方法 关键点 坐标 样本
4
一种针对FreeRTOS缓冲区溢出漏洞的图神经网络检测方法
缓冲区溢出漏洞 矩阵 检测缓冲区溢出 神经网络模型 Word2Vec模型
5
一种基于时序样本分析的输电线路监测系统通用重复告警抑制方法
输电线路监测系统 告警抑制方法 热力图 深度学习网络 时序
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号