一种基于安全意识聚集的强化学习交通信号控制方法

正文

推荐专利

申请号：CN202411581849

申请日期：2024-11-07

公开号：CN119380547B

公开日期：2025-12-16

类型：发明专利

摘要

本发明公开了一种基于安全意识聚集的强化学习交通信号控制方法，包括：构建模型；训练所述模型，包括：步骤一：获取历史状态信息；步骤二：更新第一模块，所述第一模块包括状态编码器、动作‑状态编码器、溢流编码器和等待编码器；步骤三：更新第二模块，所述第二模块包括行动者网络、奖励批评者网络、溢流代价批评者网络和等待时间批评者网络；步骤四：重复步骤一至步骤三，直至超过预设次数，得到训练后的模型；获取当前时刻的观测信息，将当前时刻的观测信息输入至训练后的行动者网络中，得到当前动作以控制交通信号。本发明将安全性融入到环境交互、状态表征以及策略学习三方面，提高交通的安全性。

技术关键词

交通信号控制方法状态编码器交叉口网络表达式模块梯度下降算法超参数策略车辆信息更新信息处理车道因子道口阶段密度

系统为您推荐了相关专利信息

一种基于未来网络的数据通信系统及方法

网元设备数据通信方法数据通信系统网络拓扑负荷

一种基于基模高斯光束的双焦光学系统优化方法及系统

光强矫正模型系统优化方法端点双焦光学系统

用于全媒体融合交换平台的资源动态调度方法及系统

资源动态调度方法媒体会话资源配置参数平台工业远程监控

一种基于人工智能的食品加工控制方法和系统

烧烤炉数据处理模型加热视频循环神经网络模型

在役风机主轴原位超声裂纹检测及缺陷识别系统及其识别方法

风机主轴缺陷识别系统裂纹缺陷声纹特征多尺度卷积神经网络

一种基于安全意识聚集的强化学习交通信号控制方法

站点导航

APP 下载