摘要
本发明公开了一种面向单GPU环境的AI模型并行训练任务调度方法及装置,属于单GPU资源调度领域,所述方法为:基于预设时间间隔获取单GPU环境的当前硬件资源状态和空闲量;若当前硬件资源状态为空闲状态,按先进先出规则从训练请求队列获取当前训练请求,并输入资源消耗预测模型得到硬件资源消耗量,资源消耗预测模型由基于历史训练数据处理的第一样本数据集训练深度学习神经网络获得;若硬件资源消耗量小于空闲量,则在单GPU环境创建训练进程并训练对应AI模型。因此,通过实施本发明,能够解决现有技术中难以在保障单张GPU上进行多个AI模型训练的同时、提高单张GPU资源利用率的问题。
技术关键词
资源消耗预测
深度学习神经网络
任务调度方法
样本
任务调度装置
特征归一化方法
标签
算术平均值
分支
先进先出
微调方法
梯度下降法
数据获取模块
训练数据处理
进程
编码方法
数值
队列
系统为您推荐了相关专利信息
信息提取模型
蒙特卡洛
图像处理方法
粒子滤波器
图像编码器
射频指纹提取
对讲机
深度学习网络模型
射频指纹特征提取
信号处理技术
水轮机叶片
拓扑优化方法
流固耦合分析
水平集方法
双线
产地鉴别方法
大数据技术
逻辑回归模型
鉴别装置
样本
长短期记忆网络
序列
数据
训练预测模型
计算机设备