摘要
本发明属于新能源电力技术领域,提出一种基于时空混合强化学习与蒙特卡洛模拟的新能源电力智能决策方法及系统,包括:获取历史电力状态数据进行数据预处理;训练得到输出调控操作概率分布的先验策略网络;利用蒙特卡洛模拟生成状态空间;基于DQN算法训练,得到用于蒙特卡洛模拟的神经网络;采用动态概率融合机制进行联合决策。本发明突破现有电力调度辅助系统中单一策略网络泛化能力不足、状态评估不准确、动态响应滞后的技术瓶颈,提升风险控制和智能决策的能力。
技术关键词
蒙特卡洛
智能决策方法
DQN算法
智能决策系统
数据
电力调度辅助系统
时序依赖关系
策略
新能源电力技术
新能源出力预测
Softmax函数
负荷预测偏差
时序特征
动态
网络模块
皮尔逊相关系数