摘要
本申请公开了一种基于深度强化学习的光储充变压器能量优化方法及系统,旨在解决短期经济调度损害长期设备安全的技术问题。该方法构建一个分层强化学习控制架构,包括一个在慢时间尺度决策的高层策略智能体,和一个在快时间尺度决策的底层策略智能体。高层策略智能体依据高保真物理模型量化的核心电力设备的长期健康状态指标,生成面向未来的策略性安全边界;底层策略智能体接收该安全边界作为其决策的刚性约束,并在该约束内根据实时运行参数,执行以短期经济最优为目标的能量调度。本申请通过该分层架构,将长期安全目标提升为短期经济目标的上层强制性约束,解决了二者的内在冲突,显著提升了系统的长期运行安全性和全生命周期总成本的最优化。
技术关键词
策略性
能量优化方法
电力设备
能源系统
深度强化学习
分层强化学习
变压器
固态电解质界面膜
储能电池荷电状态
决策
绕组热点温度
核心
设备健康状态
物理
神经网络架构
光伏发电功率
强化学习算法
系统为您推荐了相关专利信息
Actor模型
学习训练方法
代码结构
编辑
补丁
无故障概率
多模态深度学习
电力设备振动信号
融合特征
多层次
电力设备故障
大语言模型
知识图谱构建方法
文本
命名实体识别
电力设备表面
缺陷检测方法
深度学习模型
局部纹理特征
缺陷检测系统