摘要
本发明提供了一种综合能源系统的调度方法、装置、计算机设备及介质,属于能源调度领域,该方法包括:获取综合能源系统的状态信息和设备运行的运行信息;根据综合能源系统构建马尔可夫决策过程;根据马尔可夫决策过程构建基于模型的策略优化算法MBPO的智能体,利用神经网络构建环境模型,基于环境模型模拟的经验样本优化MBPO智能体的策略;根据优化后的策略,通过智能体调度综合能源系统中各设备的运行。这样,利用环境模型快速生成的模拟经验以及允许智能体更广泛地探索可能的状态和动作,能够适应复杂多变的综合能源系统环境,提高了对综合能源系统中多能源调度能力,并减少智能体与现实世界交互的次数,提高采样效率,减少综合能源系统的运行成本。
技术关键词
综合能源系统
深度神经网络
策略
样本
决策
计算机设备
处理器
调度装置
算法
风速
可读存储介质
模块
存储器
负荷
误差
程序
系统为您推荐了相关专利信息
高效存储方法
负载均衡算法
小数据
分析监控数据
索引策略
时序决策模型
暖通设备控制方法
舒适度
物联网平台
时序预测模型
飞行控制方法
倾转旋翼飞行器
可倾转旋翼
飞行动力学模型
走廊
回归预测模型
工艺参数优化方法
钕铁硼粉
压型
输出特征
快速充电方法
深度强化学习
锂电池
SAC算法
脉冲工况