摘要
本申请公开了一种大模型的资源调度方法及模型训练方法。涉及人工智能技术领域,该方法包括:获取大模型对应多个计算节点在历史时间段的负载历史数据,并确定大模型的当前运行资源;将负载历史数据输入至负载预测模型中,利用负载预测模型对多个计算节点在预设时间段的负载进行预测,得到负载预测数据;基于负载预测数据确定多个计算节点中部署的模型实例的部署结果;基于部署结果和当前运行资源进行资源调度。通过本申请,解决了由于相关技术中大模型的资源调度的准确性较低导致的大模型的资源利用率较低的技术问题。
技术关键词
资源调度方法
时间段
样本
模型训练方法
数据
节点
可读存储介质
人工智能技术
计算机程序产品
资源分配
处理器
电子设备
副本
指令
存储器
系统为您推荐了相关专利信息
直流电晕放电
模式识别方法
深度卷积神经网络
数字单反相机
模式识别系统
植被分类方法
随机森林
高分辨率遥感数据
样本
mRMR算法
数据共享方法
生成数据集合
密钥
解密
RSA算法
动态优化方法
果酒发酵
智能控制系统
动态演化模型
微生物菌种