摘要
本发明提供一种提供算力的智能计算中心云平台多模型训练任务分组方法及装置,涉及智能计算中心、智算中心及算力基础设施技术领域,该方法包括:步骤S1:接收用户的任务请求,任务请求中包含训练大模型的配置需求信息;步骤S2:基于配置需求信息将用户划分到指定用户组,生成用户组的总配置需求信息;步骤S3:基于总配置需求信息预估用户组所需的算力资源;步骤S4:根据预估结果为用户组分配算力资源;步骤S5:调度算力资源执行用户组的大模型训练任务;针对每个用户的训练任务,将训练任务划分为多个子任务,将多个子任务中分发到算力资源上执行;算力资源在执行一用户的子任务的过程中,可利用空闲时间执行用户组内的另一用户的子任务。
技术关键词
配置需求信息
计算中心
多模型
云平台
基础设施技术
资源分配模块
分组装置
处理器
可读存储介质
计算机程序产品
子模块
规模
存储器
电子设备
指令
系统为您推荐了相关专利信息
导诊机器人
智能引导方法
智能云平台
障碍物
识别患者身份
装配式墙板
深化设计方法
参数优化设计
BIM软件
建筑
图像检测方法
置信度阈值
多模型协同
语义特征
网络结构
边缘计算中心
预警方法
连续变量量子密钥分发技术
量子低密度奇偶校验码
编码技术