摘要
本发明公开了一种多空间尺度的多智能体强化学习方法、系统、设备及介质,其中方法包括:将分布式新能源电力系统中的每个微电网设为智能体,同时将新能源电力系统为分布式电网智能体,从而构建去中心化部分可观测马尔可夫决策过程;基于去中心化部分可观测马尔可夫决策过程,设计策略网络和价值网络;基于去中心化部分可观测马尔可夫决策过程及策略网络和价值网络的设计,采用多智能体强化学习方法及经验回放技术,训练得到每个智能体的最优策略。从而实现了控制空间维度的指数缩减,避免维度灾难;以及加速多智能体强化学习收敛速度,提高了算法性能。
技术关键词
智能体强化学习方法
多智能体强化学习
分布式新能源
新能源电力系统
分布式电网
回放技术
决策
微电网
多空间
策略
存储程序代码
强化学习系统
神经网络结构
定义
可读存储介质
学习设备
处理器
存储器
系统为您推荐了相关专利信息
主动解列方法
新能源电力系统
有功功率
卷积神经网络提取
解列策略
分布式电源出力
多智能体强化学习
交互方法
时间段
负荷
多智能体强化学习
注意力机制
矩阵
数据
门控循环单元
知识图谱库
等值方法
动态更新
知识图谱模型
电压等级电网
围护结构
数字孪生模型
调温系统
智能建筑
数据采集层