摘要
本发明公开了一种基于多智能体强化学习的救灾物资配送算法,涉及计算机应用技术领域,本算法涵盖基于多智能体强化学习的马尔可夫过程建模、包含基于注意力机制的编解码器的深度神经网络以及相应的训练和应用方法;马尔可夫过程建模建立救灾物资配送的问题形式化表述,深度神经网络用于学习车队策略,其中编码器以配送任务目标地点作为输入,输出目标地点的嵌入向量,解码器结合环境状态与上述嵌入向量输出车辆下一个任务点;神经网络的训练依赖于模拟环境与经典多智能体强化学习训练算法,训练好的网络可部署于现实场景中;该算法针对紧急救灾场景中时间要求高、物资需求不明、车辆合作复杂等问题而提出,可用于各类紧急物资递送场景。
技术关键词
多智能体强化学习
救灾物资
车辆
点嵌入向量
编码器
定义
多头注意力机制
信息更新
策略
深度神经网络学习
坐标
算法规划
训练算法
预估到达时间
解码器
系统为您推荐了相关专利信息
A星算法
车辆前方障碍物
道路环境信息
车辆定位信息
多项式
感应同步器
姿态故障
测角系统
一元线性回归模型
稳定系统
停车场寻车方法
移动终端
平面图
停车场寻车装置
交叉点