一种多智能体系统及其深度强化学习负载均衡方法

正文

推荐专利

申请号：CN202510843697

申请日期：2025-06-23

公开号：CN120803699A

公开日期：2025-10-17

类型：发明专利

摘要

本发明公开了一种多智能体系统及其深度强化学习负载均衡方法，这种方式降低了智能体选择动作的复杂性，能更容易达到整体上的性能最优。本发明将请求分配划分为两个阶段，第一个阶段中央智能体选择数据中心，第二个阶段本地智能体选择节点，从而避免多智能体环境不稳定的问题。此外对每个智能体的请求分配都建模成马尔科夫决策过程，对状态空间、动作空间、奖励函数和状态转移的定义做了详细的说明。在网络结构方面，本发明采用了对决网络，相较于单流的Q网络，对决网络具有学习更快更好的特点。在探索与利用方面，本发明使用了改进的面向负载均衡的动作探索策略。最后，本发明给出了算法的伪代码和学习过程图，说明了算法的训练过程。

技术关键词

多智能体系统深度强化学习算法负载均衡方法分布式数据中心节点资源决策分支内存实体阶段时间段熵权法策略网络结构调度器

系统为您推荐了相关专利信息

一种基于3DE的BIM数据轻量化流转方法

流转方法贴图文件夹节点层级

模拟仿真方法和装置、电子设备和存储介质

模拟仿真方法节点速率气相模拟仿真装置

图数据处理方法、装置、设备、介质和程序产品

大语言模型数据处理方法节点关系数据处理装置

基于骨架模型的机床几何模型还原方法、系统及存储介质

骨架模型节点还原方法加速度还原系统

一种芯粒资源调度方法

瓦片智能模型神经网络处理器策略资源调度方法

一种多智能体系统及其深度强化学习负载均衡方法

站点导航

APP 下载