一种面向单GPU环境的AI模型并行训练任务调度方法及装置

AITNT
正文
推荐专利
一种面向单GPU环境的AI模型并行训练任务调度方法及装置
申请号:CN202511070746
申请日期:2025-07-31
公开号:CN121029341A
公开日期:2025-11-28
类型:发明专利
摘要
本发明公开了一种面向单GPU环境的AI模型并行训练任务调度方法及装置,属于单GPU资源调度领域,所述方法为:基于预设时间间隔获取单GPU环境的当前硬件资源状态和空闲量;若当前硬件资源状态为空闲状态,按先进先出规则从训练请求队列获取当前训练请求,并输入资源消耗预测模型得到硬件资源消耗量,资源消耗预测模型由基于历史训练数据处理的第一样本数据集训练深度学习神经网络获得;若硬件资源消耗量小于空闲量,则在单GPU环境创建训练进程并训练对应AI模型。因此,通过实施本发明,能够解决现有技术中难以在保障单张GPU上进行多个AI模型训练的同时、提高单张GPU资源利用率的问题。
技术关键词
资源消耗预测 深度学习神经网络 任务调度方法 样本 任务调度装置 特征归一化方法 标签 算术平均值 分支 先进先出 微调方法 梯度下降法 数据获取模块 训练数据处理 进程 编码方法 数值 队列
系统为您推荐了相关专利信息
1
基于可控生成的图像处理方法、系统、终端和介质
信息提取模型 蒙特卡洛 图像处理方法 粒子滤波器 图像编码器
2
一种针对TDMA对讲机的射频指纹提取方法
射频指纹提取 对讲机 深度学习网络模型 射频指纹特征提取 信号处理技术
3
结合双线学习神经网络与共形映射的水轮机叶片拓扑优化方法
水轮机叶片 拓扑优化方法 流固耦合分析 水平集方法 双线
4
基于大数据技术的三七产地鉴别方法、存储介质以及装置
产地鉴别方法 大数据技术 逻辑回归模型 鉴别装置 样本
5
缓存空间的容量调整方法及计算机设备
长短期记忆网络 序列 数据 训练预测模型 计算机设备
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号