摘要
本发明公开了一种基于多智能体深度强化学习的光储直柔建筑集群优化运行方法、系统、设备及介质,属于光储直柔建筑集群优化运行技术领域,包括:构建包含多个建筑单元的建筑集群优化运行模型;将建筑集群优化运行模型的建筑集群优化问题表述为部分可观察马尔可夫决策过程,每个建筑单元的智能体根据局部观测信息进行决策;应用多智能体强化学习算法对部分可观察马尔可夫决策过程,通过集中训练与分散执行的策略优化智能体的决策进行求解。本发明所提POMDP在保护各建筑数据隐私的前提下,所设计的奖励函数考虑了柔性负荷集中转移可能导致建筑运行压力,有效缓解了某一时刻负荷过度集中的情况。
技术关键词
多智能体深度强化学习
优化运行方法
集群
建筑单元
多智能体强化学习
决策
策略
负荷
优化运行技术
优化运行系统
更新网络参数
柔性
离线
算法
光伏系统
阶段
处理器
计算机设备
系统为您推荐了相关专利信息
任务调度
分布式数据中心
联合优化方法
双时间尺度
热管理
机器学习模型
条件概率模型
智能预警方法
异常数据检测
自定义模块
硬件资源利用率
数据重删方法
中央处理器
后端磁盘
哈希算法
服务优化方法
轨迹预测模型
编码块
资源分配
数据编码