摘要
本发明公开了一种基于多智能体深度强化学习的大规模车辆控制方法,经过定义离散控制指令对应连续控制信号、超参数设置、模型搭建、小规模环境的模型训练、网络权重更新、目标网络软更新和迭代更新的步骤,最终将迭代之后的模型部署到大规模高速公路变道与超车控制场景中,实现大规模车辆的控制。本发明方法将多智能体决策过程分解为多个单智能体决策过程,有效降低参数数量。接着,改进离散软演员‑批评家(Di screte Soft Actor‑Cr it ic,DSAC)算法,提高值网络训练的稳定性。同时,充分考虑交通场景中车辆的有限影响范围,提出基于椭圆邻域的奖励方案,鼓励相互影响的车辆形成合作的联合动作,减少计算资源并提高训练效率。
技术关键词
车辆控制方法
网络
深度强化学习
车道中心线
表达式
小规模
邻域
定义
前轮转向角
梯度下降算法
策略
车头
控制器
参数
信号
决策
加速度
系统为您推荐了相关专利信息
二维卷积神经网络
全光谱
水质监测方法
融合时空特征
水体
故障预测模型
故障预测方法
阶段
周期
特征提取网络
智能光纤配线
协同调度方法
LSTM模型
机器人
网络拓扑信息
神经网络控制器
障碍物躲避方法
冗余度机械臂
表达式
关节