摘要
本发明公开了一种大模型调度系统、方法、服务器、介质及产品,包括:模型管理模块、算力调度模块与模型调度模块;所述模型管理模块,用于响应客户端针对目标大模型的管理操作,对所述目标大模型进行对应的模型管理;所述算力调度模块,用于针对每个大模型,根据所述大模型的模型参数信息确定与所述大模型匹配的目标算力资源节点,并将所述大模型挂载至所述目标算力资源节点上的容器中;所述模型调度模块,用于获取各所述容器的容器参数信息,在所述容器参数信息存在异常时,对挂载在异常容器上的大模型进行模型调度处理。上述技术方案,提高算力资源利用率,实现高效的算力资源选择与大模型调度。
技术关键词
容器
模型调度方法
节点
异常信息
资源
调度系统
模块
客户端
计算机程序产品
监控服务器
可读存储介质
指令
交换机
过滤单元
处理器通信
处理单元
存储器
系统为您推荐了相关专利信息
DBSCAN算法
储能系统
充放电储能
数据
平衡辅助系统
电网故障预警方法
预警模型
搜索算法优化
故障特征
编码器
采动应力监测系统
煤矿工作面
三向应力传感器
无线传感节点
数字孪生模型