摘要
本发明公开了一种考虑司机执行效能的公交动态驻站决策方法,包括以下步骤:S1、实时采集公交运行数据;S2、构建关于驻站时长的强化学习模型;S3、使用采集的运行数据训练公交智能体,通过深度强化学习算法求解生成驻站时长决策,将决策结果通过车载设备或移动终端通知司机执行;实时监控获得司机执行效能数据,通过反馈机制优化算法参数;S4、采用训练完成的公交智能体在公交线路中进行验证,达成动态驻站策略优化。还公开了一种考虑司机执行效能的公交动态驻站决策系统,采用了如前所述的公交动态驻站决策方法。本发明将司机执行效能考虑到强化学习方法中来优化驻站策略,提高了公交车的规律性和运营效率。
技术关键词
执行效能
强化学习模型
司机
决策方法
深度强化学习算法
强化学习框架
乘客上下车时间
动态
决策系统
车头
SAC算法
神经网络参数
数据采集模块
公交车站
决策算法
公交站点
系统为您推荐了相关专利信息
调度系统
智能调度算法
平台调度方法
融合注意力机制
网约车数据
光伏发电控制系统
硅叠层太阳能电池
储能系统
智能控制模块
深度强化学习模型
船体外板曲面成形
智能决策方法
支持向量机模型
Sigmoid函数
仿真数据
劳保用品
深度Q网络
深度强化学习算法
天然气站场
生成作业
物流配送路径优化
协作式
车辆状态监测
车辆监控
路径优化算法