摘要
本发明提供一种基于元强化学习的数据中心制冷系统能耗优化方法及系统,涉及能耗优化领域。本发明中,首先,构建基于数据中心制冷系统运行特性马尔科夫决策过程;其次,采用元强化学习算法构建策略网络,其中针对制冷系统对控制动作连续性与物理可行性的要求,提出引入动作平滑与约束正则化的软演员评论家算法,以执行策略网络的内循环策略更新;最后,利用策略网络对能耗优化进行动态优化控制,在识别到当前任务为新任务时,通过执行内循环策略更新微调述策略网络,以生成相应的最优控制策略。本发明能够在不同运行环境间实现策略的快速迁移与自适应优化。
技术关键词
数据中心制冷系统
能耗优化方法
策略更新
强化学习算法
SAC算法
网络
能耗优化系统
冷却塔风机
冷水机组
冷却水
决策
动态优化控制
冷冻水流量
水泵
参数
系统为您推荐了相关专利信息
电梯故障检测方法
故障运行状态
故障预测模型
深度强化学习算法
故障特征
大语言模型
动态场景感知
场景分类
电力
评价方法
作业调度优化方法
模型训练模块
环境状态信息
策略更新
最大化资源利用率
转速控制方法
水泵
冷却液
深度Q网络
新能源汽车热管理技术