摘要
本申请公开了一种基于负载感知的GPU算力资源调度方法、设备及介质,算力调度涉及技术领域。方法包括:根据GPU的显存容量和计算核心数量,将显存容量划分为多个连续片段,将计算核心划分为多个逻辑计算组,得到子资源单元;实时记录子资源单元的占用状态和负载指标,得到资源池;对用户提交的作业解析,采集作业运行时内核函数的执行周期、显存访问模式和指令流水线阻塞率;基于强化学习算法,根据负载指纹模型预测作业的资源需求拐点,基于虚拟化隔离与多维资源量化评估,对子资源单元分层调度,生成子资源单元的抢占式分配策略。本申请通过上述方法通过动态粒度切分、负载感知调度与硬件级安全隔离的协同设计,实现了GPU资源的高效利用与安全共享。
技术关键词
资源调度方法
指令流水线
强化学习算法
指纹模型
调度系统
核心
计算机可执行指令
策略
内核
拓扑图
资源调度设备
周期
蚁群优化算法
逻辑
异构
集群
分层
模式
系统为您推荐了相关专利信息
生物力学特征
牵引方法
表面肌电信号
粘弹性系数
数字孪生体
策略
数据吞吐量
深度强化学习算法
传播算法
决策
空地协同
反制设备
强化学习算法
策略
博弈论模型
特征提取模块
数据采集层
期货交易所
特征工程
数据转换模块
出行特征
监控单元
公共交通车辆
调度系统
分析单元