摘要
本发明公开了一种基于强化学习的启停通道决策方法及系统,包括采用Brilon模型构建交通流中断概率模型,刻画拥堵概率与交通流参数之间的关系;将启停通道决策问题转化为马尔可夫决策过程,确定所述马尔可夫决策过程的状态空间、动作空间和状态转移概率;采用Q‑Learning算法对所述马尔可夫决策过程进行求解,得到启停通道决策。本发明可以对未来一段时间内的交通状况做出准确预判,提前规划应急车道的使用策略;通过优化启停决策逻辑,减少了不必要的资源浪费,同时提升了应急车道使用的合理性和效率,确保了关键时候的生命线畅通无阻。
技术关键词
决策方法
交通流参数
强化学习算法
通道
车道
决策系统
数据压缩算法
速度
策略
密度
因子
视频
着色
关系
输出模块
系统为您推荐了相关专利信息
柔性控制方法
导纳控制器
充电插头
强化学习算法
轨迹