在大模型训练场景下的NUMA调度方法、装置、设备及介质

正文

推荐专利

申请号：CN202510706034

申请日期：2025-05-29

公开号：CN120560811A

公开日期：2025-08-29

类型：发明专利

摘要

本申请公开了在大模型训练场景下的NUMA调度方法、装置、设备及介质，涉及人工智能技术领域，包括：采集目标集群拓扑关系配置文件；获取与当前大模型训练任务的图形处理器需求对应的目标亲和性策略，如为第一亲和性策略，基于拓扑关系配置文件从各处理器节点中筛选出包括候选NUMA节点的候选处理器节点，候选NUMA节点为单个NUMA节点下图形处理器的空闲数量满足图形处理器需求的NUMA节点，根据各候选NUMA节点的性能通信评分从各候选NUMA节点中确定目标NUMA节点；在训练容器启动时，调度目标NUMA节点下的各图形处理器完成当前大模型训练任务。使得大模型训练的效率提升、成本降低。

技术关键词

图形处理器节点训练场景策略关系容器集群序列存储计算机程序人工智能技术调度装置模块可读存储介质列表连续性键值电子设备存储器

系统为您推荐了相关专利信息

基于融合技术的博物馆文物环境监测方法及系统

环境监测方法博物馆调控策略功率器件卷积神经网络技术

一种基于职业教育智能化公共实训平台的构建方法及系统

实训车间实训平台策略优化模型任务分配信息职业

一种电网负荷优化智能控制系统及方法

负荷电力分配智能控制系统卷积神经网络模型曲线

一种烤烟叶的氮素吸收分析方法、装置、设备及存储介质

多元线性回归模型分析方法周期标记同位素分析

一种基于硬提示的全域图数据统一图建模方法

大语言模型建模方法数据自然语言标签标准化

在大模型训练场景下的NUMA调度方法、装置、设备及介质

站点导航

APP 下载