摘要
本发明提供一种基于强化学习的普速铁路列车运行调整方法及系统,属于铁路调度指挥技术领域,考虑列车运行过程中的动态性和随机性,以列车在各车站的总延误最小以及货物列车停站次数最小为目标,构建普速铁路列车运行调整模型;基于强化学习DQN求解算法对普速铁路列车运行调整模型分两阶段求解,实现普速列车运行调整。本发明考虑到货物列车在区间运行时分的不确定性,并在调整时优先考虑货物列车与客运列车之间的优先级关系,以尽量减少对客运列车的延误。并通过运用强化学习技术,结合现场实际的调度措施,使智能体探索并实现更优的调度方案。
技术关键词
非暂态计算机可读存储介质
DQN算法
铁路调度指挥技术
求解算法
神经网络优化器
决策
处理器
车站
强化学习技术
存储器
电子设备
铁路列车
指令
策略
计算机设备
阶段
变量
系统为您推荐了相关专利信息
仿真方法
气泡
结构化网格
结晶器内流场
结晶器内钢液
维修决策方法
DQN算法
深度强化学习
动态
网络
指令
地址映射
芯片
非暂态计算机可读存储介质
数据获取单元