摘要
本发明涉及电力系统频率控制领域,具体涉及基于深度强化学习的非线性电力系统无模型负荷频率控制方法;构建双网络架构,根据双网络架构优化执行器网络参数;基于预训练的PID网络参数初始化所述执行器网络,通过随机扰动生成探索噪声进行控制空间探索,基于经验回放机制迭代优化执行器网络参数至收敛,得到训练好的执行器网络;生成频率控制指令。本发明通过对称差分估计解决深度网络梯度异常问题,避免了传统基于梯度下降方法中因复杂网络结构导致的梯度消失或爆炸问题,确保智能体参数更新的稳定性和可靠性;最后采用经验回放机制迭代优化执行器网络参数,实现电力系统在调速器死区和发电速率约束等非线性特性下的无模型频率控制。
技术关键词
负荷频率控制方法
深度强化学习
执行器
双网络架构
电力系统频率偏差
仿真器
非线性
参数
构建深度神经网络
控制策略
频率控制系统
网路
ReLU函数
机制
系统为您推荐了相关专利信息
数据安全监测
分析方法
数据采集层
基线
深度强化学习模型
光学检测方法
图像误差
多轴协同运动
机械臂系统
补偿算法
脉冲神经网络模型
故障检测系统
执行器
故障检测单元
光伏组件单元
强化学习模型
网络资源分配方法
深度Q网络
重构误差
信号
等离子体控制系统
交互式可视化
测试平台
客户端
文档生成模块