摘要
本发明公开了一种基于生成式预训练模型(GPT)和深度强化学习的实时最优潮流方法,涉及电网智能调控技术领域,利用大语言模型领域技术突破,将不可量化的自然语言规定直接建模为OPF问题中的目标和约束。该方法包括建立综合性能指标、设定上下文和问题、利用GPT智能体反馈转化为奖励信号、迭代采样、以JSON格式输出GPT智能体结果并导入DRL智能体、进行离线训练和在线应用等步骤。DRL过程使用三个深度神经网络,通过原始‑对偶方法优化成本函数,设置包括语言规定约束在内的一系列约束条件,可在线应用于实时解决OPF问题。
技术关键词
深度强化学习
潮流方法
预训练模型
大语言模型
优化深度神经网络
深度确定性策略梯度
智能调控技术
节点导纳矩阵
梯度下降算法
随机梯度下降
文本
无功负荷
答案
格式
在线
自然语言
离线
系统为您推荐了相关专利信息
代码评审方法
代码评审系统
代码评审技术
分层策略
评审工作
开路故障诊断方法
注意力机制
故障诊断模型
充电模块
故障分类模型
多模态特征融合
注意力
融合特征
损失计算方法
图片