摘要
本发明提供了一种基于奖励函数评估的分布式智能电网系统调度方法、装置、设备及存储介质,该方法包括:建立分布式智能电网系统模型,并获取所述分布式智能电网系统模型的历史输入数据;根据所述分布式智能电网系统模型和所述历史输入数据,确定所述分布式智能电网系统模型的状态集合、动作集合和反馈评估奖励函数;确定半确定性训练机制,并根据所述半确定性训练机制、所述状态集合、动作集合和反馈评估奖励函数,利用深度强化学习算法进行离线学习,得到分布式智能电网系统最优调度策略;根据所述分布式智能电网系统最优调度策略,输出对应的在线评价网络输出动作值。以此方式,可以实现分布式智能电网能量系统经济效益与用户满意度均衡调度。
技术关键词
分布式智能电网
深度强化学习算法
系统调度方法
充电站
数学模型
计算机程序指令
网络接口
策略
离线
机制
负荷
非易失性存储器
指标
计算机存储介质
利润
能量系统
恒温
蓄电池
放电开关
系统为您推荐了相关专利信息
延时补偿方法
单极性单周期控制
主动磁悬浮轴承
延时补偿系统
开关
温度获取方法
实体
Web平台
数据服务器
数据中心
服务器
面向电动汽车
能量消耗
移动车辆
卸载方法
智能调度管理系统
动态关系图谱
新能源电池
节点
延迟量