摘要
本发明公开了一种基于MADDPG的电网企业购售电联合策略优化方法及系统,包括:构建电网公司在现货市场的购电决策模型以及电网公司在用户端的供给模型,并考虑电网公司供电的偏差损失,得到电网公司的联合决策目标函数;并通过多智能体算法训练智能体在整体目标一致的前提下,分别给出购电和负荷预测的最优策略,采取强化学习算法MADDPG,既符合电网公司难以获取用户全部信息的客观事实,同时避免通过建模预测耗费的大量算力,通过两个智能体的互相策略逼近,保证了智能体训练过程的动态稳定性,提升算法的效率和模型求解效果。
技术关键词
策略优化方法
发电机组
决策
负荷
电力
企业
节点边际电价
信息熵
功率约束条件
序列
偏差
样本
模块
强化学习算法
训练智能
网络
表达式