摘要
本发明公开了基于因果变压器模型的交通信号控制方法,包括将多交叉口交通信号控制定义为马尔科夫决策过程,其中,每个交叉口作为一个独立的智能体,确定智能体的状态、动作以及奖励;引入基于双模拟学习的状态提取模型,通过度量两个状态之间的行为相似性来捕获适合控制的状态表示、同时剔除与控制无关的信息;基于变压器模型,配置嵌入层、变压器编码层以及因果解码层,以提取状态、动作以及奖励之间的因果关系;通过最小化奖励的损失函数拟合动作预测层、状态预测层、奖励评估层以及动作生成层。本发明提取智能体的状态、动作以及奖励之间的因果关系,让变压器模型能够有效理解交通行为与智能体动作之间的动态关联,从而优化交叉口的交通信号。
技术关键词
交通信号控制方法
变压器模型
状态编码器
度量
表达式
交叉口交通信号
车道
解码
平均等待时间
梯度下降算法
运动
变量
定义
指标
生成动作
系统为您推荐了相关专利信息
变流器控制方法
虚拟阻抗控制
电流双环控制
比率
锁相环控制
城市内涝预测方法
机器学习技术
表达式
节点
构建数学模型
移动储能车
路径规划方法
路径规划装置
两阶段
进化算法