一种面向单GPU环境的AI模型并行训练任务调度方法及装置

正文

推荐专利

申请号：CN202511070746

申请日期：2025-07-31

公开号：CN121029341A

公开日期：2025-11-28

类型：发明专利

摘要

本发明公开了一种面向单GPU环境的AI模型并行训练任务调度方法及装置，属于单GPU资源调度领域，所述方法为：基于预设时间间隔获取单GPU环境的当前硬件资源状态和空闲量；若当前硬件资源状态为空闲状态，按先进先出规则从训练请求队列获取当前训练请求，并输入资源消耗预测模型得到硬件资源消耗量，资源消耗预测模型由基于历史训练数据处理的第一样本数据集训练深度学习神经网络获得；若硬件资源消耗量小于空闲量，则在单GPU环境创建训练进程并训练对应AI模型。因此，通过实施本发明，能够解决现有技术中难以在保障单张GPU上进行多个AI模型训练的同时、提高单张GPU资源利用率的问题。

技术关键词

资源消耗预测深度学习神经网络任务调度方法样本任务调度装置特征归一化方法标签算术平均值分支先进先出微调方法梯度下降法数据获取模块训练数据处理进程编码方法数值队列

系统为您推荐了相关专利信息

基于可控生成的图像处理方法、系统、终端和介质

信息提取模型蒙特卡洛图像处理方法粒子滤波器图像编码器

一种针对TDMA对讲机的射频指纹提取方法

射频指纹提取对讲机深度学习网络模型射频指纹特征提取信号处理技术

结合双线学习神经网络与共形映射的水轮机叶片拓扑优化方法

水轮机叶片拓扑优化方法流固耦合分析水平集方法双线

基于大数据技术的三七产地鉴别方法、存储介质以及装置

产地鉴别方法大数据技术逻辑回归模型鉴别装置样本

缓存空间的容量调整方法及计算机设备

长短期记忆网络序列数据训练预测模型计算机设备

一种面向单GPU环境的AI模型并行训练任务调度方法及装置

站点导航

APP 下载