摘要
本发明属于车辆充电技术领域,具体涉及一种基于深度强化学习的电力数据调度方法、系统和设备。该方法包括如下步骤:S1:建立一个表征充电站充放电调度优化问题的数学模型。S2:将数学问题建模为马尔可夫决策过程,并基于DQN算法模型构建一个调度优化网络。S3:根据充电站的运行数据对调度优化网络进行训练,使得其在不断的决策和学习中自适应的获得较好的控制策略,以最大化充电站的经济效益和用户的服务满意度。S4:充电站的控制中心获取当前车辆的需求信息,然后利用完成训练的调度优化网络生成满足当前用户需求的最佳充放电方案。本发明解决了现有采用V2G技术的充放电调度方案难以有效平衡客户需求和充电站效益的问题。
技术关键词
数据调度方法
深度强化学习
充电站
数学模型
DQN算法
数据调度系统
充放电功率
控制中心
电力
网络
决策
全局状态信息
车辆充电技术
控制策略
初始化系统
表达式
贪婪策略
调度设备
系统为您推荐了相关专利信息
协同跟踪控制方法
非线性多智能体系统
动态系统模型
动态数学模型
控制器
深度强化学习
周围环境数据
车辆控制方法
网络
驾驶员误踩油门
功率优化控制方法
DAB变换器
数学模型
KKT条件
表达式