一种在混合交通流环境下基于混合深度强化学习的端到端车群协同决策方法

正文

推荐专利

申请号：CN202411813468

申请日期：2024-12-11

公开号：CN119294437B

公开日期：2025-03-14

类型：发明专利

摘要

本发明涉及智能交通技术领域，且公开了一种在混合交通流环境下基于混合深度强化学习的端到端车群协同决策方法。该方法通过设计了一种针对复杂交通场景的图结构建模方法，从底层实现了交通参与者之间的通信机制，其次，本发明基于图卷积方法的时空编码器实现了对环境观测中时空信息的有效嵌入，为系统理解环境中的时空耦合信息实现了前提条件，最后，将actor‑critic架构与Q学习架构深度耦合，构建了一种新型的适用于混合动作空间的强化学习方法，基于该方法完成模型训练后，可通过保存与加载模型参数实现模型的部署，部署完成的模型可通过输入环境观测数据从而输出被控车群的协同决策。

技术关键词

连续型混合交通流深度强化学习模型决策方法策略网络图结构结构建模方法参数表达式广义强化学习方法智能交通技术笛卡尔坐标系编码器概率密度函数卷积方法掩码矩阵噪声

系统为您推荐了相关专利信息

电力交易策略生成方法、装置、设备及存储介质

交易策略生成方法利润电力负荷预测生成程序策略生成装置

一种机器人行走控制方法、装置、设备及介质

策略引导机器人控制机器人行走正则化方法算法

一种基于大数据的互联网消费智能监测系统及方法

智能监测系统大数据互联网显著性检验方法智能监测方法

改进猎豹优化算法的光伏并网逆变控制器参数辨识方法

参数辨识方法双闭环控制策略光伏并网逆变器三相光伏发电系统算法

一种数据中心智能液冷控制方法及系统

抗体液冷控制方法人工免疫算法优化约束条件参数

一种在混合交通流环境下基于混合深度强化学习的端到端车群协同决策方法

站点导航

APP 下载