摘要
本发明涉及信息处理技术领域,尤其是涉及一种基于强化学习的施工隧道交通信号灯控制方法和系统,其包括:S1、构建施工隧道道路‑交通灯仿真马尔可夫模型;S2、构建GC_PPO强化学习模型,对施工隧道交通信号灯控制策略进行训练;S3、将训练后的强化学习模型用于施工隧道交通信号灯控制。本发明提出了一种施工隧道交通信号控制仿真模型,该模型可视为一个马尔可夫过程,以施工隧道各道路车辆作为状态,能够接受交通信号灯控制相位作为输入,并返回该相位控制下隧道的运行状况作为回报。本发明技术方案利用GC_PPO强化学习对施工隧道交通灯策略进行训练,能够在不依赖外部数据的情况下,学习获得当前隧道的优秀策略。本发明技术能够对施工隧道交通灯进行智能实时控制,在此智能控制下,施工隧道车辆能够实现高效,公平,安全的行驶,能够避免因为道路狭窄而造成的冲突或拥堵。
技术关键词
施工隧道交通
信号灯控制方法
马尔可夫模型
强化学习模型
交通流
交通场景建模
隧道交通灯
生成隧道
信号灯控制系统
交通信号灯控制
掌子面
深度学习框架
控制策略
强化学习算法
信息处理技术
仿真环境
仿真模型
系统为您推荐了相关专利信息
高速公路流量预测方法
多模态特征
双通道神经网络
历史监测数据
序列
满堂支架
平移装置
盘扣式
拉绳位移传感器
建立数据采集系统
物资优化调度方法
装备
消防
风险预测模型
大数据