一种基于负载感知的GPU算力资源调度方法、设备及介质

正文

推荐专利

申请号：CN202510673986

申请日期：2025-05-23

公开号：CN120653430A

公开日期：2025-09-16

类型：发明专利

摘要

本申请公开了一种基于负载感知的GPU算力资源调度方法、设备及介质，算力调度涉及技术领域。方法包括：根据GPU的显存容量和计算核心数量，将显存容量划分为多个连续片段，将计算核心划分为多个逻辑计算组，得到子资源单元；实时记录子资源单元的占用状态和负载指标，得到资源池；对用户提交的作业解析，采集作业运行时内核函数的执行周期、显存访问模式和指令流水线阻塞率；基于强化学习算法，根据负载指纹模型预测作业的资源需求拐点，基于虚拟化隔离与多维资源量化评估，对子资源单元分层调度，生成子资源单元的抢占式分配策略。本申请通过上述方法通过动态粒度切分、负载感知调度与硬件级安全隔离的协同设计，实现了GPU资源的高效利用与安全共享。

技术关键词

资源调度方法指令流水线强化学习算法指纹模型调度系统核心计算机可执行指令策略内核拓扑图资源调度设备周期蚁群优化算法逻辑异构集群分层模式

系统为您推荐了相关专利信息

一种智能骨科牵引方法、系统及装置

生物力学特征牵引方法表面肌电信号粘弹性系数数字孪生体

MEC赋能的车载元宇宙中基于主动推理的优化方法及系统

策略数据吞吐量深度强化学习算法传播算法决策

空地协同的无人机反制信号自适应生成方法及系统

空地协同反制设备强化学习算法策略博弈论模型

通过历史期货线性图结合大数据分析未来期货行情的系统

特征提取模块数据采集层期货交易所特征工程数据转换模块

一种基于出行特征异质换乘需求响应的快速衔接自适应调度系统

出行特征监控单元公共交通车辆调度系统分析单元

一种基于负载感知的GPU算力资源调度方法、设备及介质

站点导航

APP 下载