基于去中心化多智能体强化学习的库存资源调度方法

正文

推荐专利

申请号：CN202510230085

申请日期：2025-02-28

公开号：CN120258360A

公开日期：2025-07-04

类型：发明专利

摘要

本发明公开了基于去中心化多智能体强化学习的库存资源调度方法，针对现有的基于多智能体强化学习库存调度方法存在的维数灾难和无法高效进行仓库间协作的问题，提出了基于图的奖励聚合的去中心化多智能体强化学习算法，通过节点之间固有的耦合关系把全局值函数化简为局部值函数，同时剔除冗余信息，减小了值函数的输入维度，降低值函数的拟合难度，并利用奖励聚合机制传递不同节点的偏好信息，以实现高效协作；通过局部值函数训练每个节点的策略，训练完成后每个节点只需要获取自身的观测值就能得到对其拥有资源的分配方案，本发明通过去中心化处理能够处理更加大规模的资源调度问题。

技术关键词

多智能体强化学习仓库资源调度方法资源分配更新网络参数库存调度方法关系邻居注意力机制节点拓扑图策略随机噪声算法冗余因子

系统为您推荐了相关专利信息

一种基于拍卖算法的工业互联网边缘算网协同方法及系统

拍卖算法工业互联网协同方法时延云端服务器

智能存储高算力工控芯片的高带宽接口优化方法及设备

接口优化方法缓存策略高带宽数据访问信息时钟同步

基于多智能体强化学习的组网雷达协同欺骗干扰决策方法

组网雷达多智能体强化学习干扰决策方法多智能体协同策略优化模型

立体仓库智能存储优化方法、引擎和计算机程序产品

存储优化方法立体仓库时间段计算机程序产品启发式算法

数据处理方法、装置、设备及存储介质

数据处理方法标签意图识别智能外呼机器人数据处理装置

基于去中心化多智能体强化学习的库存资源调度方法

站点导航

APP 下载