摘要
本发明提出一种基于深度强化学习的港口综合能源系统动态优化方法,该方法包括:1)构建港口综合能源系统环境,包括定义系统状态空间、动作空间以及奖励函数;2)构建基于近端策略优化的深度强化学习算法,包括策略网络、价值网络、信赖域裁剪函数、优势函数和时间差分误差;3)构建深度强化学习算法与港口综合能源系统环境交互产生的轨迹集,用于更新算法参数;4)使用更新后的深度强化学习算法对港口综合能源系统环境进行训练,生成动态调度策略。本发明通过深度强化学习技术实现了港口综合能源系统的动态优化运行,充分考虑了系统的时序决策特性,提高了系统的灵活性和可再生能源的利用率,实现了港口综合能源系统的高效和灵活运行。
技术关键词
深度强化学习算法
综合能源系统
动态优化方法
策略
电储能
网络
深度强化学习技术
定义系统
负荷
燃气轮机机组
轨迹
误差
功率
参数
船舶
系统为您推荐了相关专利信息
高增益观测器
锂离子动力电池
联合估计方法
扩展卡尔曼滤波器
电池表面温度
理化特征
参数预测方法
酒窖
指标
训练神经网络模型