摘要
本发明公开了一种可扩展的高速公路交通流管控的多策略协同优化方法,包括:S1.基于交通流管控策略的不同类型定义相对应的强化学习动作空间;S2.基于交通流观测状态定义相对应的强化学习状态空间;S3.基于不同目标系数定义强化学习的奖励函数;S4.构建仿真训练环境;S5.基于动作空间、状态空间、奖励函数、仿真训练环境构建强化学习智能体策略;S6.在仿真训练环境中对构建的强化学习智能体策略进行优化,得到最优强化学习智能体策略;S7.获取实际环境状态,根据最优强化学习智能体策略计算实际环境状态的最优交通流管控策略。
技术关键词
协同优化方法
交通流
策略
路段
强化学习算法
动态车道
参数
定义
因子
车辆
入口
密度
系统为您推荐了相关专利信息
智能家居调控方法
分布式传感器网络
采集环境参数
家居设备
多传感器融合技术
医疗影像数据
实时数据传输
数据分析模型
数据压缩
传输方法