摘要
本发明公开了一种源荷双侧调峰辅助服务市场投标与激励联合策略优化方法、系统、装置及存储介质,属于电力市场交易技术领域。方法包括根据调峰辅助服务市场和激励型需求响应市场的参数数据,构建面向负荷聚合商和火电机组的双市场联合优化模型;将双市场联合优化模型形式化为马尔可夫决策过程;构建多任务多智能体强化学习训练框架;通过异步训练多任务多智能体柔性动作‑评价算法对多任务多智能体强化学习训练框架进行求解,得到负荷聚合商竞标与激励最优联合策略以及火电机组的最优竞标量与报价策略。本发明同时考虑多个市场参与者之间的博弈行为和需求侧市场主体在双市场中的联合决策行为,广泛适用于电力市场中多任务的智能体协同优化问题。
技术关键词
调峰辅助服务
负荷
火电机组智能
多智能体强化学习
策略优化方法
联合损失函数
多任务
激励型需求响应
下火电机组
智能体神经网络
决策
评价算法
定价策略
轨迹
火电机组深度调峰
调峰需求