摘要
本发明公开了一种全链路环境预检系统、方法、设备、介质及程序产品,涉及计算机技术领域,包括:接口层接收作业参数;环境感知层监测全链路环境中的硬件资源状态,依次获取可用显存容量,节点间带宽和可用内存容量;资源需求预测层将作业参数与硬件资源状态进行耦合建模,并根据构建的预测模型来预测显存需求量,网络需求量和内存需求量;风险评估层根据获取的可用显存容量,节点间带宽和可用内存容量,以及预测的显存需求量,网络需求量和内存需求量,计算风险因子,并根据风险因子和设定分级告警规则进行风险评估。这样通过动态感知、精准预测与科学风险评估,显著提升了作业部署的可靠性与资源利用效率。
技术关键词
预检系统
需求预测模型
作业参数
内存
预检方法
风险
链路
因子
节点
网络
告警规则
建立数据传输通道
图形处理器
生成优化建议
块设备
时间序列模型
资源
可读存储介质
存储计算机程序