摘要
本发明公开了一种基于强化学习的电动汽车‑光伏充电站协调控制方法。首先建立一个配备光伏(PV)的电动汽车充电站的充放电模型。将电动汽车‑光伏充电站协调控制转化为马尔可夫博弈过程,确定马尔可夫博弈过程中的观测、动作和奖励。建立一种新的多智能体强化学习算法MAT来解决电动汽车‑光伏充电站协调问题;使用MAT算法在真实的数据上进行训练,并测试算法的精度,从而实现电动汽车‑光伏充电站协调控制。本发明使用了一种基于Transformer架构的多智能体强化学习算法MAT,从而将算法复杂度增长从乘法减少到加法,并且提高奖励,确保获得的奖励是全局最优的,提高电动汽车充电站的运营效益,促进可再生能源的消费。
技术关键词
光伏充电站
协调控制方法
强化学习算法
光伏发电功率
收入
站点管理系统
注意力机制
定义
更新网络参数
序列
编码器参数
输入解码器
电力
系统为您推荐了相关专利信息
路径规划方法
深度强化学习算法
DQN算法
策略
神经网络参数
控制单元
高维特征向量
多层卷积神经网络
无线通信单元
流量传感器
数据中心
数据传输模块
任务调度方法
深度强化学习算法
服务质量约束
物联网管理系统
协议
通信模块
多智能体Q学习
协调控制器
数据通信方法
数据采集策略
数据采集频率
移动终端
强化学习算法