摘要
一种用于人工智能服务的集群资源分配方法、装置及产品,涉及大模型、人工智能、集群技术领域。该方法包括:获取部署有人工智能服务的集群的资源使用信息,集群包括专用节点、共享节点和弹性节点,专用节点用于部署推理子服务,共享节点至少用于部署训练子服务和数据处理子服务,弹性节点至少用于部署机器学习平台子服务;根据资源使用信息,确定集群的资源状态;根据资源状态,对人工智能服务进行资源分配。不仅能够在同一集群下满足人工智能服务的数据处理、模型训练、推理服务以及机器学习平台的多种服务需求,而且能够根据集群的资源使用信息对人工智能服务进行资源的动态分配,不仅减少响应延迟,而且有效提高节点资源的利用率。
技术关键词
人工智能服务
机器学习平台
集群资源分配方法
节点
策略
中子
机器学习模型
资源分配装置
指标
分布式任务调度
调度器
存储装置
集群技术
计算机程序产品
模块
显卡
电子设备
系统为您推荐了相关专利信息
策略优化方法
碰撞模型
飞行员反应时间
数据输入结构
加速度
非线性
电力系统参数
建立电力系统
训练神经网络
样本集构建方法
智能分析系统
关键性
云端数据中心
深度学习算法
短时傅里叶变换
虚拟同步机
变流器
并联系统
优化控制方法
有功功率