摘要
一种基于拥堵预测与DRL的智能电动车队队列优化方法,步骤包括:(一)将电动车队的队列位置优化问题建模为以能量均衡为目标、受交通环境约束的数学模型;(二)采用基于TRPO算法的DRL方法求解步骤(一)的数学模型,获得电动车队的最优队列调整策略。在步骤(二)中,通过LSTM交通预测与FCM方法获取外部交通环境中的拥堵状态信息,并与车队中各车辆的剩余电量和累计行驶距离共同作为TRPO算法的状态输入;TRPO算法采用策略网络与价值网络分别得到调整队列位置的策略,以及评估当前状态下的回报预期。TRPO算法通过约束策略更新的KL散度,动态调整策略更新步长,保证策略更新过程中的稳定性和收敛性。
技术关键词
队列优化方法
智能电动车
累计行驶距离
Hessian矩阵
数学模型
车辆
算法
策略更新
长短期记忆网络
智能车队
模糊C均值
初始聚类中心
深度强化学习
交通流
时序误差
交通特征
系统为您推荐了相关专利信息
智能泵组
粒子群优化算法
响应负载变化
智能阀门
数学模型
智能空调控制方法
温度预测模型
热传导
模糊PID控制器
深度信念网络
输电导线
三维空间模型
非线性有限元
气象
数学模型