摘要
本发明涉及一种基于分层强化学习的车辆无人机协同调度方法,属于交通运输和物流技术领域,解决了现有技术中“地空一体”联合运输成本高、效率低和资源配置不合理的问题,包括:步骤S1,构建城市快速物流运输的交互式仿真环境;步骤S2,利用r‑MDP基于车辆无人机的协同调度过程构建车辆无人机动态调度模型;步骤S3,设计分层强化学习算法框架,并通过分层强化学习算法框架求解车辆无人机动态调度模型,得到协同调度策略;以及步骤S4,将得到的协同调度策略代入构建的交互式仿真环境中进行验证,得到验证结果,若验证结果满足预设要求,输出该协同调度策略用于车辆无人机协同调度,否则返回步骤S3修改参数并重新构建分层强化学习算法框架。
技术关键词
分层强化学习
无人机协同
协同调度策略
动态调度模型
算法框架
仿真环境
车辆
决策
计划
无人机飞行速度
参数
网络结构
启发式算法
定义
数据
物流