摘要
本发明涉及电动汽车车队调度技术领域,具体涉及一种计及车路网交互特性的电动汽车车队调控方法及系统;本发明方法包括以路网拓扑信息、车辆状态信息及环境状态信息作为状态变量,将电动汽车聚合调控过程构建为马尔可夫决策过程模型,通过融合图神经网络的强化学习A2C算法构建电动汽车车队调控决策模型,通过状态‑动作‑奖励数据集对电动汽车车队调控决策模型进行训练,以最大化车队收益为优化方向,对电动汽车车队调控决策模型的神经网络参数进行梯度下降和更新,得到训练后的电动汽车车队调控决策模型,采用训练后的电动汽车车队调控决策模型对电动汽车车队进行调控;通过本发明提高了车队的运行效率、总收益,降低了车队运营成本。
技术关键词
节点特征
决策
环境状态信息
依赖关系信息
车辆状态信息
充电站
调控方法
神经网络参数
出行需求
策略
充电桩数量
拓扑特征
队列
收入
订单
矩阵
算法