基于松散同步的城市交通强化学习并行训练方法

正文

推荐专利

申请号：CN202510297260

申请日期：2025-03-13

公开号：CN120219137A

公开日期：2025-06-27

类型：发明专利

摘要

本发明涉及强化学习技术领域，且公开了基于松散同步的城市交通强化学习并行训练方法，包括以下步骤：S1、路网分区及初始化；S2、初步模拟与数据记录；S3、松散同步通信；S4、边界处理；S5、并行奖励计算；S6、模型训练与策略更新；S7、收敛性验证。本发明中，提出每轮强化学习训练结束时才进行信息的跨区域同步，取代传统每回合每个时间步均进行一次信息同步的方式，显著减少了通信频率。这避免了因同步通信成本过高而拖慢整体训练效率的问题，在大规模交通网络仿真和强化学习训练中，能有效降低同步开销，提升训练速度。

技术关键词

并行训练方法分区强化学习模型车辆策略更新仿真器进程交通状态信息误差函数强化学习技术强化学习算法模拟器节点密度速度邻域多线程压力决策

系统为您推荐了相关专利信息

一种远程启动车辆方法及车辆

远程启动车辆加密数据车身电子加密算法

一种高铁大跨度斜拉桥行车安全分析方法和系统

竖向加速度大跨度斜拉桥轮轨力 LSTM模型二系悬挂

车辆路径规划方法和装置、电子设备及存储介质

车辆路径规划方法车辆规划路径节点变量符号

一种针对智能底盘的无人麋鹿测试系统与方法

麋鹿智能底盘高风险车辆外轮廓坐标系

一种基于触觉与视觉双模态感知的车载人机交互预警系统及其控制方法

车载人机交互环境检测模块预警系统双模态数据处理模块

基于松散同步的城市交通强化学习并行训练方法

站点导航

APP 下载