摘要
本申请公开了一种含电动汽车的虚拟电厂控制方法、系统、设备及介质,涉及虚拟电厂控制领域,该方法包括:将虚拟电厂控制问题建模为分布式部分可观测马尔可夫决策模型;分布式部分可观测马尔可夫决策过程包括若干智能体、虚拟电厂的全局状态、所有智能体的联合观测、各智能体的局部观测、所有智能体的联合动作、各智能体的动作和奖励函数;构建价值网络和策略网络;一智能体对应一策略网络;利用强化学习方法,对价值网络和策略网络进行集中训练,得到价值网络和每一策略网络对应的最优控制策略;基于最优控制策略,确定虚拟电厂的控制方案,本申请防止用户信息泄漏,实现更好的充放电控制性能,降低电动汽车用电成本并减少用户里程焦虑。
技术关键词
策略
强化学习方法
网络
虚拟电厂控制系统
充放电功率
拼接模块
注意力编码器
蒙特卡洛算法
决策
充放电动作
线性
处理器
焦虑
电池
样本
计算机设备
可读存储介质
存储器
系统为您推荐了相关专利信息
偏好评估方法
神经网络训练
分支
多层感知机
文本