摘要
本申请涉及一种基于多智能体强化学习的多式联运路径选择方法。所述方法包括:构建多式联运运输网络与系统环境;基于多式联运运输网络与系统环境采用自适应大邻域搜索算法进行初始规划;当出现意外事件时,获取意外事件信息,基于意外事件信息结合成本目标函数采用多智能体强化学习算法对初始规划进行优化,得到意外行动决策,基于意外行动决策执行运输任务。通过构建融合ALNS的大邻域扰动响应机制,当检测到节点/路径服务时间偏移超过阈值时,智能触发路径重构并生成新的备选路径,基于MADDPG多智能体强化学习框架,各承运人Agent能够在集中训练中获得全局信息,在执行中独立决策,有效提升运输资源的利用效率和任务分配公平性。
技术关键词
多智能体强化学习
邻域搜索算法
全局状态信息
规划
决策
强化学习框架
处理器
计算机设备
可读存储介质
存储器
模块
重构
机制
节点
网络
资源
参数