摘要
本发明涉及一种基于太阳能的多能互补建筑供能系统,涉及建筑供能领域,提取联合特征并计算当前状态下各备选调度策略参数的Q值;根据当前储能设备SOC与预设安全阈值的偏离度和电网电价计算状态风险因子,确定与所述状态风险因子成反比的探索概率,并根据所述探索概率在随机探索与利用具有最大Q值的调度策略参数之间进行选择;以所选择的调度策略参数作为优化边界,构建并求解混合整数线性规划模型,得到设备控制动作;根据所述设备控制动作计算当前时间步的建筑运行成本并将所述运行成本的相反数作为奖励值;将包含当前状态、所选调度策略参数、奖励值及新状态的经验样本存入经验回放池;更新评估网络。
技术关键词
混合整数线性规划模型
建筑供能系统
储能设备
设备控制
策略
光伏发电功率预测
充放电功率
参数
长短期记忆网络
因子
深度Q网络
风险
太阳能
梯度下降法
数据采集模块
样本
时序