摘要
本发明提供一种基于强化学习的公交动态多目标优化调度方法。首先初始化车队规模和单程集合,将运营时段切分为多个重调度阶段;构建当前重调度阶段的强化学习模型;利用强化学习模型,依次对当前重调度阶段的每个决策点进行决策,形成当前重调度阶段的最优解;重复多次当前重调度阶段的决策过程,形成当前阶段的最优解集;依次处理每个重调度阶段,直到所有重调度阶段全部处理完毕。通过本发明提出的方案,能够使得车辆调度方案更加适应现实的运营环境,充分考虑目标之间的冲突,提升公交的运营水平与服务质量。
技术关键词
决策
阶段
强化学习模型
优化调度方法
公交车
深度Q学习网络
强化学习网络
规模
车辆
排序方法
状态更新
动态
定义
在线
复杂度
站点
参数
策略
算法
速度
系统为您推荐了相关专利信息
优化调度方法
热电单元
低碳经济
蝙蝠算法
蓄能单元
英语教学方法
教师
英语教学系统
训练人工智能模型
序列
载波通信系统
深度强化学习模型
分布式协同
载波通信方法
人工智能模型
软硬件监控
图谱
模块
自然语言问答
智能运维技术
智慧消防设备
故障识别方法
分类子模型
历史设备
隐马尔科夫