摘要
本申请公开了一种基于异步多智能体强化学习的双层非合作需求响应方法,包括:S1、构建双层非合作博弈框架,包括:构建公用事业公司与消费者之间的双层动态博弈模型;S2、完成部分可观测马尔可夫博弈建模,将双层非合作博弈转化为部分可观测马尔可夫博弈;S3、设计异步多智能体强化学习算法作为博弈均衡的求解引擎;S4、实施集中训练与优先级经验回放实现异步多智能体强化学习算法效率优化。本申请适用于智能电网环境下公用事业公司与消费者群体之间动态博弈场景,能够实现电网中分布式能源的高效消纳与负荷波动抑制。
技术关键词
多智能体强化学习
响应优化方法
非合作博弈
策略更新
天气
储能系统充放电
编码器参数
需求响应方法
阶段
负荷
指标
网络解码器
能源
算法
决策
系统为您推荐了相关专利信息
电力故障抢修
路径优化方法
优化调度模型
天气
抢修路径
智能报警系统
数据采集层
智能监控平台
气象监测模块
天气
风险预警方法
城市道路
数字孪生体
积水
路面状态预测
低轨遥感卫星
资源分配方法
时延
资源分配系统
策略更新方法