摘要
本申请提供了一种基于深度强化学习的高铁列车时刻表优化与重调度方法,涉及高铁调度和资源优化技术领域,旨在实现高效准确的高铁列车时刻表优化与重调度。包括:基于高铁调度的马尔可夫决策过程模型,构建策略网络,所述策略网络学习了所述高铁调度的马尔可夫决策过程模型的动作决策策略;将当前车站状态输入策略网络,得到动作决策为当前车站所有列车的发车顺序;基于列车状态转移模型,根据当前车站所有列车的发车顺序模拟列车运行环境,确定出满足行车安全约束的当前车站所有列车的到达时间和发车时间;按照以上步骤,依次迭代计算出运行路线上各个车站所有列车的到达时间和发车时间,得到列车时刻表。
技术关键词
车站
列车时刻表
决策
策略
高铁列车
状态转移模型
注意力
深度强化学习算法
编码
网络
节点
资源优化技术
状态转换模型
静态特征
轨道
列车运行信息
系统为您推荐了相关专利信息
信息解析方法
多维度校验规则
电商
动态权重分配
多模态特征
路径追踪方法
动态障碍物
模糊控制器
协作场景
速度障碍法
动态调度方法
智能运维平台
策略
指数
加权融合算法