一种基于大模型指导强化学习的配电网供电恢复决策方法

正文

推荐专利

申请号：CN202510817184

申请日期：2025-06-18

公开号：CN120709969A

公开日期：2025-09-26

类型：发明专利

摘要

本发明公开了一种基于大模型指导强化学习的配电网供电恢复决策方法，获取配电网供电恢复问题的任务描述信息，基于此构建配电网供电恢复问题的马尔可夫决策过程。基于马尔科夫决策过程，搭建强化学习环境，并构建k个采用DDQN算法的强化学习模型。利用大模型的代码生成与优化能力，自动生成k个高质量的奖励函数代码，并用于训练强化学习模型。同时设计配电网供电恢复问题的奖励函数反馈提示和代码格式化提示，通过在每轮迭代后采用任务适应度函数评估强化学习模型的整体性能，并结合奖励反思机制动态优化奖励函数。采用多次随机重启策略，有效降低搜索陷入局部最优的风险。本发明可在复杂的配电网环境下生成高效、稳定的供电恢复方案。

技术关键词

恢复决策方法强化学习模型强化学习环境强化学习策略配电网参数格式化配电网拓扑结构变量线路定义分布式电源因子数值节点有功功率浮点数辐射状

一种基于大模型指导强化学习的配电网供电恢复决策方法

站点导航

APP 下载