摘要
本发明公开了一种基于PPO强化学习算法的多端口逆变器控制方法,首先构建以多端口逆变器工作状态为环境、以端口功率和网侧输出电压为控制目标,以功率分配因子和调制波为直接控制变量的Actor‑Critic网络框架,利用PPO算法对Actor和Critic进行联合训练,以状态观测器的状态量作为观测输入,输出用于调节多端口逆变器调制策略的最优动作,通过与环境的交互训练,可在无模型条件下实现功率分配与电压控制策略的自适应优化。
技术关键词
多端口逆变器
逆变器控制方法
强化学习算法
网络
两电平
状态观测器
开关
参数
电压
因子
梯度下降法
分支
谐波失真
高压
扇区
功率控制
控制策略