摘要
本申请公开了一种计算资源调度系统及方法,其包括步骤:集群管理模块从服务器集群中的各个服务器探测计算资源以得到服务器可用计算资源的集合;将所述服务器可用计算资源的集合同步到资源管理模块,所述资源管理模块基于所述服务器可用计算资源的集合构建可用资源视图;响应于控制模块接收到部署模型指令,所述控制模块根据待部署模型的相关信息确定部署所述待部署模型所需的计算资源;所述控制模块向调度模块请求调度,所述调度模块基于调度算法从所述可用资源视图得到分配的计算资源列表;以及,基于所述分配的计算资源列表,部署所述待部署模型。这样,统一服务器上的空闲算力,能够提供多机多卡调度方式,减少计算资源闲置,提升资源利用率。
技术关键词
计算资源调度方法
语义
控制模块
因子
调度算法
编码向量
服务器集群
集群管理
转换器结构
调度系统
列表
sigmoid函数
资源分配模块
动态
数据项
服务器节点
聚类
系统为您推荐了相关专利信息
控制无人机飞行
指定时间间隔
采集脑电信号
脑电信号采集模块
信号处理模块
深度语义分析
大语言模型
项目
语义向量
召回方法
指纹图像修复方法
数据分布
噪声图像
指纹特征
随机噪声