摘要
本发明总体涉及交通流系统模型的建立以及基于Lyapunov价值函数的强化学习交通流量控制方法。包括:建立交通流系统的数学模型;构建环境模拟器,将系统的边界控制问题转化为马尔可夫过程;以及设计基于Lyapunov价值函数的SAC强化学习算法,通过与环境模拟器的交互训练Actor‑Critic网络,通过Actor网络输出的最优控制器实现交通流系统的流量控制。
技术关键词
强化学习算法
模拟器
速度控制方法
交通流量控制方法
策略
非线性
收集训练数据
离散化步长
更新网络参数
控制器
数学模型
系统边界
观察系统
仿真环境
构建系统
建模方法
系统为您推荐了相关专利信息
模糊PID控制
移动平均滤波
低压蒸汽流量
焚烧锅炉
累计偏差
动态路径规划
小麦收割机
任务分配方法
分布式拍卖算法
运粮车
显示器设备
亮度调节方法
数据处理单元
调节控制单元
信号收发模块
传感器标定系统
传感器标定方法
纱线
电机控制器
标定算法