摘要
本发明公开了一种基于DQN实现公交上下行动态均衡时刻表生成方法,包括初始化公交线路信息、获取线路上下行的历史交通状况与客流信息、初始化强化学习DQN模型参数、构建可生成公交上下行动态均衡时刻表的DQN模型,包括设计可生成公交上下行动态均衡时刻表的DQN模型的状态矩阵、动作状态、奖励函数,本发明通过DQN模型的推理,输出公交上下行动态均衡时刻表结果,采用直接与仿真环境交互来训练,在实时仿真环境中进行决策,实现实时方式生成公交上下行动态均衡时刻表,可基于变化后的客流及站点信息推理生成新的发车时刻表,解决现有发车时刻表不能动态适应客流与交通状况变化,导致排班不符合实际要求而不能应用的问题。
技术关键词
时刻表
生成方法
动态
公交车
仿真环境
车辆载客状态
平均等待时间
DQN算法
线路
公交站点
代表
定义
数据
计划
决策
行程
刷卡
参数