摘要
本发明公开了一种电能质量调控方法、装置、设备、介质及程序产品。该方法包括:获取调控节点的配电网观测数据;将配电网观测数据输入多智能体深度强化学习模型,获得电能质量调控动作;其中,多智能体深度强化学习模型基于马尔可夫决策过程做出决策;多智能体深度强化学习模型由调控中心根据各智能体基于本地目标样本数据确定的经验值训练得到;对调控节点所在的配电网执行电能质量调控动作。通过将电能质量调控问题转化为马尔可夫决策问题,采用集中训练‑分散执行的框架,依靠每个智能体的局部观测数据与配电网的持续交互中不断优化其控制策略并且依据调控中心的全局评估能力提供准确的价值估计,在保证局部观测的同时实现多智能体协同运行。
技术关键词
多智能体深度强化学习
调控方法
深度强化学习模型
电能
贝叶斯概率矩阵分解
调控系统
样本
数据处理模块
节点
网络
计算机程序产品
多智能体协同
决策
处理器
可读存储介质
数据获取模块
调控装置
电子设备
系统为您推荐了相关专利信息
强化学习模型
调控方法
温室气体排放量
污泥
悬浮固体含量
阵列生物芯片
存储管理方法
深度强化学习模型
计算机程序指令
空间分布特征
数字孪生
能量消耗
通信资源分配
无线通信网路
机器可读指令