一种基于安全强化学习的交通信号控制方法及系统

正文

推荐专利

申请号：CN202411538432

申请日期：2024-10-31

公开号：CN119252047A

公开日期：2025-01-03

类型：发明专利

摘要

本发明公开了一种基于安全强化学习的交通信号控制方法及系统，所述方法包括：获取多个历史状态信息，并利用注意力网络、行动者网络、奖励批评者网络和代价批评者网络处理得到第一概率值、第一奖励价值、第二奖励价值、第一代价价值和第二代价价值，然后通过奖励优势评估函数和代价优势评估函数得到优势评估值和代价评估值；基于优势评估值、代价评估值、第一概率值、奖励值、第一奖励价值、代价值和第一代价价值优化行动者网络、奖励批评者网络和代价批评者网络，重复上述过程，直至超过预设次数，得到训练后的行动者网络；获取当前时刻的观测信息，并输入至训练后的行动者网络得到当前动作以控制交通信号。本发明在保证效率下确保路口的安全性。

技术关键词

交通信号控制方法网络交叉口交通信号控制系统车道表达式梯度下降算法注意力密度参数阶段策略轨迹因子模块误差

系统为您推荐了相关专利信息

模型权重部署方法、装置、电子设备、存储介质和程序

存算一体芯片阵列尺寸神经网络模型矩阵

一种基于边缘计算的天然气管道泄露检测方法

泄露检测方法天然气管道多尺度特征提取应力波传播速度微尺度

一种基于多层神经网络的多声音事件检测方法

声音事件检测方法事件检测模型融合经验模态分解多头注意力机制胶囊网络

一种场站多端直流系统的直流母线电压控制方法及系统

多端直流系统并网变流器变流器控制方法有功功率生成同步信号

一种基于注意力机制胶囊网络的高光谱影像分类方法

影像分类方法胶囊网络模型注意力机制权重特征主成分分析法

一种基于安全强化学习的交通信号控制方法及系统

站点导航

APP 下载