摘要
本发明涉及一种面向一体化的列车自主运行速度曲线智能优化方法和系统,包括:构建基于离散距离的虚拟编组下的自主列车速度曲线优化模型;将自主列车速度曲线优化模型转化为马尔科夫决策过程;在马尔科夫决策过程中,利用深度强化学习算法TD3训练神经网络与智能体,得到训练好的神经网络与智能体;将训练好的神经网络与智能体部署到自主列车中,以进行自主列车速度曲线的优化决策,从而能够实现列车自主安全、高效及舒适运行。
技术关键词
深度强化学习算法
训练场景
道岔
训练神经网络
智能优化方法
决策
曲线
智能优化系统
强化学习环境
列车动力学
神经网络参数
索引
仿真环境
终点
加速度
数据更新
线路
记忆