摘要
本发明提供一种基于轨迹的多智能体协作强化控制交通信号灯的方法。本发明首先根据历史轨迹和邻居节点的时空状态对未来轨迹进行预测。之后将轨迹的状态映射到嵌入空间,进而利用长短期记忆网络对信息进行聚合。嵌入空间中的距离被用作衡量轨迹相似度的指标。在相似轨迹对的基础上,本发明进一步提出了一种协作式强化学习算法。该算法通过将相似智能体之间的经验进行高效迁移,实现智能体间以知识协作为基础的协作学习,提升模型的训练效率和泛化能力。针对大规模分布式的交通信号控制场景,提出一种协作式强化学习的协同控制方法,有效的解决了集中式和分布式控制带来的问题,提升网络吞吐量和交通流量调度效率。
技术关键词
控制交通信号灯
轨迹
前馈神经网络
注意力机制
交通流量调度
节点
序列
多层感知机
协作式
协同控制方法
长短期记忆网络
强化学习算法
网络吞吐量
元素
分布式控制
神经网络模型
交通路口
邻居
服务器
系统为您推荐了相关专利信息
基因预测方法
自动编码器
皮尔逊相关系数
算法
建立预测模型
多模态
车道线信息
巡航控制方法
车道中心线
智能视觉设备
探测机器人
作业对象
数据处理单元
避障单元
冰面环境
水文预测模型
水文预报方法
随机森林模型
长短期记忆网络
记忆单元
电网设备智能
大语言模型
条件随机场
条件概率模型
更新模型参数