摘要
本发明公开了一种基于鲁棒强化学习的电动汽车充电调度方法及系统,将电动汽车充电调度决策构造为马尔科夫决策模型,并且设计了一种鲁棒强化学习算法,通过提高传统强化学习算法的鲁棒性,增强电动汽车充电调度系统受网络攻击的防御水平,本方案中的鲁棒充电调度算法,面对潜在的网络攻击时,仍具备较好的调度能力,本方案提供的鲁棒强化学习算法既确保了模型在未受攻击的情况下有良好的策略表现,并且在受对抗攻击的场景中同样具备良好的策略表现,使得电动汽车在面对网络攻击进行充电调度的情况下仍能取得最优决策。
技术关键词
强化学习算法
充电调度方法
决策
充电调度系统
充放电动作
充放电策略
参数
定义
网络架构
可读存储介质
充放电功率
调度算法
电池
模块
鲁棒性
计算机
轨迹
因子