摘要
本发明公开了一种基于深度对抗逆向强化学习的智慧家庭能量管理方法,步骤如下:(1)建模智慧家庭能量成本最小化问题并设计对应马尔可夫决策过程的环境状态和动作;(2)基于一组随机参数历史数据和滚动生成法构造n组随机参数历史数据;(3)利用n组随机参数历史数据和最优化算法求解上述最小化问题并得到n条专家轨迹;(4)鉴别器基于专家轨迹和生成器智能体产生的轨迹训练奖励网络;在奖励网络的引导下,利用经验元组和近端策略优化算法对生成器智能体进行训练;(5)重复步骤(4)直到获得训练性能稳定的智能体策略;(6)将训练得到的智能体策略部署在实际环境中运行。相比现有方法,本发明方法可有效降低能量成本并提升用户舒适性。
技术关键词
电池储能系统
暖通空调系统
策略
表达式
黑盒模型
参数
智慧家庭系统
负载需求功率
算法
双曲正切函数
深度神经网络
决策
充放电功率
梯度下降法
生成轨迹
系统为您推荐了相关专利信息
异常状态
控制策略
对象
计算机设备
深度强化学习模型
选区激光熔化
路径优化方法
平衡二叉树
蚁群算法
三维模型
光学显微镜
环境传感器数据
LSTM模型
实时数据处理技术
拼接模块
图像特征提取模型
电镜
性能分析方法
通用图像数据
高分子材料
长短期记忆神经网络模型
配电网运行数据
优化调度方法
K均值聚类算法
关联规则挖掘算法