摘要
本发明涉及液冷流量分配技术领域,公开一种基于强化学习的多GPU服务器集群液冷流量分配方法,包括:S1,采集多GPU服务器中各GPU的运行状态参数,所述运行状态参数包括核心温度、电压、电流和负载利用率,通过滑动时间窗口进行热行为建模,生成表示GPU短时热趋势的热动态特征向量;S2,实时采集液冷系统各通道的流速、进出水温差和冷板热阻,将所述液冷组件表示为图结构。本发明采用基于图神经网络与强化学习联合建模的技术方案,通过对GPU热动态特征与液冷系统拓扑状态进行融合编码,且引入Actor‑Critic架构实现液冷流量的自适应调控,达到提升多GPU服务器集群散热效率与能耗平衡控制能力的技术效果。
技术关键词
流量分配方法
服务器集群
滑动时间窗口
通道
液冷系统
矩阵
策略
流速
动态
节点
拓扑特征
温差
强化学习模型
标志位
流量分配技术
液冷组件
网络
系统级
拓扑图
控制设备